Th. S. TRẦN THỊ BÍCH HỒNG 
Th. S. CAO MINH KIỀM 


TRA 0ƯU THÊN TÍN 


trong hoạt động 
thư viện thông tin 


kˆ 





TRẦN THỊ BÍCH HỒNG & CAO MINH KIỂM 


TRA ỨU THÔNG TIN 
TRONG 
H0ẠT ĐỘNG THƯ VIỆN - THÔNG TIN 


(Giáo trình dùng cho sinh viện đại học và cao đẳng 
ngành Thư viên - Thông tin) 


TRƯỜNG ĐẠI HỌC VĂN HOÁ HÀ NỘI 
HÀ NỘI, 2004 


MỤC LỤC 
Bảng chữ cái viết tẮ..................osssosseseosssssesssssseo Ö 
TL nà Hi ==ea..àa 


Chương 1. Tổng quan về tra cứu thông tin.. 14 


1L, Trà 0u KHÔNG Đá d0 ke jdd«ẽ" 14 
1,1. Một gố Khải Hiệu 00a 14 
1.2. Các dạng tra cứu thông tin. ................... 20 

2. Hệ thống tra cứu thông tin........................ .-- 31 
1...1 g0n nạ lì m ĐT, Lá 2k2... ve: 31 
ca lu Ni HA CÚ 2e de 71 
B0, Lệnh ĐỀN sáxessexccolbsasicesbiedeesokee 114 
SG HN H1... .1.ÏớýớẰ_a 115 

Chương 2. Chiến lược tra cứu thông tỉin....119 
1. Các bước của quá trình tra cứu..................... 122 
1.1. Tìm hiểu yêu cầu tin và phân tích vấn 
l0 neaeesesislietxseadkeANME Loa 123 
1.2. Thể hiện yêu cầu bằng ngôn ngữ tìm 
TS... 127 
1.3. Xác định nguồn tra eứu......................-- -- 128 
1.4. Lựa chọn công cụ tra cứu..................... 128 
1... 1H BI f8 GI edxdavieedieodidyeec 129 


1.6. Phân tích kết quả của chiến lược tìm 


TỊ Tss1409:s du 1t va00900A8666auei6aebsfo NfsikiDeo 181 

1.7. Biên tập và trình bày thông tin........... 132 
1.8. Đánh giá tính phù hợp của thông tin 

nhận Q06 3150296agas6dbxstfsốl06u0s Set 182 

2. Quá trình tìm tin tự động hoá..................... 141 
2,1 Các bước của quá trình tìm tin tự động 

HO g 26026112520 812y 6 ống Cà heelbss ni chi vàS6 23C 141 

2.2 Các bước của tìm tin trực tuyến............ 142 

3. Đánh giá hiệu quả tra cứu .......................... 143 

3.1. Tiêu chuẩn đánh giá...........................-. 143 
3.2. Các chỉ số đánh giá hiệu quả tra cứu 

CHỔ TẾ EÍNE sa 624439230 680cátojt€waddssdksiat0 00x 145 
Chương 3. Phương pháp tra cứu thông tỉn 

truyền, thống...........-.--‹-«-e-e«-«ee sg34ássaasosoel49 

1: Tra cưu tt HỆ 34:::225áasc6Á6s2xảa13xeÁistgbsgee 149 

1.1. Nguồn tra cứu chính............................ 150 

1.2. Phương pháp tra cứu...........................- lỗ] 

2. Tra cứu số liệu và dữ kiện.........................-- 172 

3.1. Nguồn tra cứu chính...........................- - 172 

2.2. Phương pháp tra tìm ...........................- 173 


3. Một số vấn đề cần lưu ý trong quá trình tra 
€U 822561 000viid0ei0fnfaszbthoghofiaebsabonsy s00-jR 8 178 





2. Cú pháp của tìm tin tự động hoá................ 188 


Ø1. Hiếu HC EU 1y116s.66805 036 e8 C42 sá 6 188 
D0 T0 TW EU 2a 10x92212g544063y 0:81 0y/xiei si 191 
2.3. Sử dụng toán tử boole........................--- 192 
9.4. Tuần từ lã]/Cấñ‹s¿‡z60o116x6ce1022,sfs2esseilbi 201 
2.5. Sử dụng ký hiệu chặt cụt..................... 206 
9-0: TÌHằ:G:ESRN (c2 vsc0122621xy8wtdesk tia bise 208 
2.7. Tìm giới hạn theo trưởng ..................:... 209 
2.8. Trình tự xử lý và thay đổi mức ưu tiên 211 
2.9. Sử dụng dấu đóng/mở ngoặc đơn ......... 212 
3. Ngôn ngữ lệnh trong tìm tin tự động hoá .. 21ö 
3.1. Hệ thống dòng lệnh .........................----- 213 
3.2. Hệ thống thực đơn........................-.-- 21ã 
8.3. Hệ thống hỗn hợp..........................------ 217 
3.4..Hệ thống tựa Web............................. 317 
4. Những bước tìm tin tự động hoá cơ bản ..... 218 
4.1 Xác định các khái niệm và thuật ngữ 
80 .ốỐốố ốc ẽ ốc... 220 
4.2. Lựa chọn chiến lược tìm tìn................. 299 
4.3. Xây dựng biểu thức tìm......................- 223 
4.4. Đánh giá sơ bộ và hiệu chỉnh kết quả 
Iinl ETG225429200 0405 g2100esbsa4i892sa0 224 
5. Chiến lược tìm tìn tự động hoá................... 226 
5.1. Chiến lược tìm ngắn gọn...................... 228 
5.9. Chiến lược xây dựng khốt................... - 228 
5.3. Chiến lược các bước liên tiếp................ 2ó 
5.4. Chiến lược mở rộng dần dần................ 233 
6. Tìm tin trực tuyến.....................àeeeenrierrreeo 233 





6.1 Quá trình phát triển của công nghiệp 


thông tin trực tuyến ............................ 536 
6.2 Các thành phần của công nghiệp thông 
tin trực tuyến...........................- sec 239 
7. Tìm tin trên CD-ROM................................. 241 
7.1. CD-ROM và cỏ sở đữ liệu trên CD- 
ROM............. `... ẽố ốc 241 
7.2 So sánh tìm tin trên CD-ROM với tìm 
Ti CPDD ĐUYỂT 42046102 nh ao ca neo bshág 346 
Chương V. Tìm tin trên mạng [NTERNET..249 
1. Những khái niệm cơ bản về Internet.......... 249 
1.1. Định nghĩa Internet.............................. 249 
1.9. Địa chỉ IP và địa chỉ tên miền............... 251 
1.3. Các dịch vụ cơ bản của Internet............ 2356 
2. World Wide Web................. co. 258 
2.1. Một số khái niệm cơ bản của World 
Wide Web........................ Si(6 h0 4Ey 3a ba ..358 
2.2. Trình duyệt Web H90 00103 60/ n0 S0SÊ0 21t 3sg 264 
2.3. Nguồn tin trên World Wide Wcb........ ..265 
3. Tìm tin trên WEB................... sa 2h 1A s04 ..267 
3.1. Máy tìm tin...................... ` ..269 
3.2. Danh bạ chủ đề............................:-..--.- ..283 
3.3. Hướng dẫn chủ đề chuyên môn hoá: ....286 
3.4. Cơ sở đữ liệu..................-..- coi rea ..288 
Hướng dẫn tự hỌọc..................‹.secsesesesessssesesesesse 289 


1- Tài liệu cần đọc................... LG con nexeo 289 





GIÁ U00 TP 1 00c 20101 0106/60xa06602902v0030 050g 008g 289 
20 GÌ DĐ 2i 21t ngay f6yla1460020055Ai3 6469222 290 
20 62H 3t bigxsrtt6ssl000s14i603taiehiddidssg 290 
D0 111: HOHTE 15:26 86a 20Y010690609530a342 1210 291 
200.1000011 Ð c6 5216x004 (0561600aagbvidvpkiefhiy 291 
8-01 Lần THứỨC HBSHN Gai ii411446i206655ga01ãsả 292 
3.1 Tìm tin truyền thống............................... 292 
3.2 Tìm tin tự động hoá............. nga. 294 
3.3 Tìm tìn trên Í[nternet........... Èi4296À66E0I s89) 304 


Tài liệu tham khảo............««.«.«eeseeesssesessssssesssse 308 





BẢNG CHỮ CÁI VIẾT TÁT 


AACR Quy tác biên mục Anh Mỹ 
(Anglo-American Cataloguing Rule) 
BBK Khung phân loại thư mục thư viện 
(Biblioteko-BIbliographicheskaia Klassificats1a) 
CP-ROM Bộ nhớ chỉ đọc trên đĩa nén 
(Compact Disc Read Ôn]ly Memory) 


DDC Bảng phân loại thập tiến Dewcy 
(Dewey Decimal Classification) 
ISBD Mô tả sách theo chuẩn quốc tế 
(Tmternational Standard Book Description) 
LCC Bảng phân loại Thư viện Quốc hội Mỹ 
(Library of Congress Classification) 
LCSH Bảng đề mục chủ đề của Thư viện Quốc hội Mỹ 
(Library of Congress SubJect Headings) 
MARC Biên mục máy tính đọc được 


(Machine ReadableCataloguing} 
MLCĐ Mục lục chủ đề 
MLCC Mục lục chữ cát 
MLPL Mục lục phân loại 


9 





OPAC 


RAMEAU 


UDC 


UNESCO 


URL 


WwW 


10 


Mục lục truy cập công cộng trực tuyến 
(On-line Public Access Catalog) 


Repertoire d Autorite' Matiere Encyclope dique 
et Alphabetique Unifie 


Bảng phân loại thập tiến quốc tế 
(Universal Decimal Classification} 


Tổ chức Giáo dục, Khoa học và Văn hoá Liên 
hợp quốc 


{United Nations's Education, Sclence and 
Culture Organisation) 


Định danh tài nguyên thống nhất, Định danh 
nguồn tin thống nhất 


(Uniform Resource Locator) 
World Wide Web hoặc Web 





LỜI NÓI ĐẦU 


Từ những năm 50 của thế kỷ XX cho đến nay với sự xuất 
hiện của nền văn minh trí tuệ thuộc các lĩnh vực khoa học, 
kỹ thuật, công nghệ, kinh tế và xã hội đã mang lại nhiều 
biến đổi sâu sắc chưa từng có trong lịch sử loài người. Trên 
thực tế, thời đại trí tuệ đang được mở màn bởi một loạt các 
cuộc cách mạng nối tiếp nhau như các mạng công nghệ, 
cách mạng thông tin với các ngành có hàm lượng khoa học 
kỹ thuật cao làm then chốt (tin học, vi điện tử, viễn thông, 
công nghệ sinh học, vật liệu mới, năng lượng mới,..). 
Những ngành này đã, đang và sẽ làm biến đổi về cơ bản về 
công cụ, các phương pháp tổ chức quản lý nền sản xuất xã 
hội cũng như dịch vụ làm cho sản xuất phát triển cao, tỉnh 
vi chưa từng thấy. Với sự phát triển của khoa học và kỹ 
thuật đã dẫn tới sự bùng nổ thông tĩn. Khối lượng tài liệu 
khoa học tăng theo cấp số nhân, phong phú về nội dung, đa 
dạng về hình thức, tồn tại dưới nhiều dạng thức khác nhau 
(dạng giấy, dạng vi phim, vi phiếu, đĩa từ, đĩa quang....). 
Đặc biệt sự phát triển cực kỳ nhanh chóng của Internet, đã 
và đang mở ra những thời cơ và thách thức mới đối với việc 
sản sinh, lưu giữ, tìm kiếm và cung cấp thông tin. 

Chính vì vậy mà việc sử dụng tài liệu và tra cứu thông 
tin gặp không ít khó khăn, đặc biệt là vấn để định hướng 
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nguồn tài liệu mới (Hàng ngày có khoảng trên 200 trang tạp 
chí khoa học: mỗi năm có khoảng trên 1Ô triệu sáng chế 
phát minh được công nhận. 5 triệu bài báo được đàng tải và 
hàng triệu cuốn sách được ra đời). Để giúp người dùng In 
định hướng. khai thác và sử dụng một cách triệt để và có 
hiệu quả các nguồn tin đó. các cơ quan thông tin - thư viện 
phải có phương pháp tra cứu một cách khoa học và lôgíc. 


Tra cứu thông tin là một trong những môn học mang 
tính khoa học. tính kĩ thuật. tính linh hoạt và định hướng 
cao. nằm trong chương trình đào tạo ngành Thư viện - 
Thông tin. Môn học trang bị cho sinh viên những thức kiến 
cơ bản, có hệ thống vẻ lí luận tra cứu thông tin, cũng như 
những kĩ năng cần thiết về phương pháp tra cứu. Giáo thả 
"Tra cứu thông tin trong hoạt động thư viêm: thông tín ˆ 
được biên soạn phù hợp nội dung chương trình giảng dạy đã 
được thông qua, phù hợp với hoạt động tra cứu trong thực tế 
rất đa đạng và phong phú đang được tiến hành ở tất cả các 
thư viện và cơ quan thông tin trong nước, cũng như tiếp cận 
được những phương pháp tìm tin tự động hoá phù hợp với 
xu hướng phát triển của ngành trên thể giới. Giáo trình 
"Tra cứu thông tin trong hoạt động tÍtư viên - thông tín ” 
dùng làm tài liệu giáng dạy và tham khảo cho cán bộ giảng 
dạy và tài liệu học tập cho sinh viên hệ đại học và cao đẳng 
ngành Thư viện - Thông tin và trong những trường hợp nhất 
định có thể làm tài liệu tham khảo cho những người quan 
tâm tới vấn đề này. 


2 





Trong quá trình biên soạn giáo trình chúng tôi nhận 
được sự đóng góp, giúp đỡ rất chân tình của các đồng 
nghiệp ở bộ môn Thông tin-Thư mục học, khoa Thông Iin- 
Thư viện trường Đại học Văn hoá và các chuyên gia trong 
ngành. Cho phép chúng tôi bày tỏ lời cảm ơn chân thành. 

Tuy đã có nhiều cố gắng, chắc chấn giáo trình cũng 
không tránh khỏi những thiếu sót. Chúng tôi rất mong sự 
chỉ dẫn và góp ý của đồng nghiệp và độc giả để giáo trình 
hoàn thiện hơn trong những lần xuất bản sau. 


Hà nội, năm 2004 
CÁC TÁC GIÁ 





CHƯƠNG 4 
TỔNG QUAN VỀ TRA CỨU THÔNG TIN 


1. TRA CỨU THÔNG TIN 

a L1 Một số khái niệm 

Nhiệm vụ chính của mỗi cơ quan thông tin - thư viện là 
giúp cho người dùng tin / khách hàng / bạn đọc định hướng, 
truy cập, lựa chọn và sử dụng thông tin từ các nguồn tin có 
trong cơ quan mình và từ các nguồn tin ở nơi khác một cách 
tốt nhất, thuận tiện và nhanh chóng nhất theo yêu cầu của 
họ. Ở bất kỳ cơ quan thông tin / thư viện thuộc hệ thống 
nào, loại hình nào cũng đều tiến hành giúp bạn đọc định 
hướng, tra cứu nguồn tìm hoặc hướng dân phương pháp 
giúp họ tự tra cứu thông tin.....Căn cứ vào mục dích và loại 
hình, các cơ quan thông tin / thư viện tổ chức phục vụ / 
dịch vụ tra cứu một cách khác nhau. Ví dụ: thư viện nhỏ chỉ 
có 1-2 biên chế, họ phải đảm nhận mọi công việc nghiệp vụ 
từ khâu bổ sung, xử lý kỹ thuật, tổ chức kho tài liệu, tổ chức 
bộ máy tra cứu, đến phục vụ, trong đó có phần tra cứu; tại 
thư viên lớn có sự phân công giữa các bộ phận tra cứu- thư 
mục với các bộ phận mượn, đọc và giữa các cán bộ trong 
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từng bộ phận với nhau. Công tác tra cứu trong cơ quan 
thông tin - thư viện bao gồm nhiều khâu công việc như: 

- Giúp người dùng tin sử dụng thư viện / cơ quan thông 
tin; 

- Trả lời các yêu cầu tin; 

- Hướng dẫn nghiên cứu các nguồn tin; 

- Giới thiệu các sản phẩm và dịch vụ hiện tại; 

- Đào tạo người dùng tin,.... 

Công việc trợ giúp người dùng tin sử dụng thư viện / cơ 
quan thông tin 

Nhiều bạn đọc đến thư viện và cần sự trợ giúp của thủ 
thư, đặc biệt là thời gian đầu mới đến sử đụng thư viện. Có 
thể họ cần giúp nghiên cứu cách sử dụng hệ thống mục lục, 
cách thể hiện phiếu yêu cầu, cách tra cứu tài liệu, nguyên 
tắc tổ chức, sắp xếp tài liệu trên giá ở các phòng tự chọn, 
hoặc cách tra cứu trong các tài liệu tra cứu; Có không ít bạn 
đọc rất quen thuộc với nguồn tin dạng giấy nhưng lại không 
gần với nguồn tin điện tử. Họ có nhu cầu giúp đỡ định 
hướng và sử dụng cơ sở đữ liệu, CD-ROM hay internet. 
Trong những trường hợp đó thủ thư cần thiết phải giải thích, 
hướng dẫn họ nghiên cứu, tìm hiểu và cách sử dụng chúng. 

Trả lời các yêu cầu tin: 

Bạn đọc đến thư viện để tìm thông tin về một tài liệu cụ 
thể một/ tập hợp tài liệu , hay một vấn đề nào đó. Họ cần sự 
giúp đỡ của thủ thư / bộ phận tra cứu vì họ không biết bắt 
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đầu xem xét từ đâu? Có những câu hỏi rất đơn giản. ví dụ: 
Có cuốn sách nào vẻ lịch sử phong trào Cân Vương có trong 
thư viện không? đến những vấn đề nghiên cứu mang tính 
tổng hợp như: Những người truyền giáo thế kỷ XVI- XVIHI 
có ảnh hưởng gì đến chính sách phát triển của Châu Á - 
Thái bình dương? Cán bộ thư viện cần phải tra cứu thông 
tin phù hợp để trả lời những câu hỏi đó. 

Hướng dẫn nghiên cứu các nguồn In: 

Nếu bạn đọc có câu hỏi mang tính tổng hợp, thủ thư có 
thể nghiên cứu và hướng dân họ sử dụng các nguồn tin khác 
nhau như: nguồn tin truyền thống có tại thư viện hay những 
nguồn tin điện tử được khai thác trên cơ sở dữ liệu, các 
mạng thông 1in hoặc internet, không í1 trường hợp thư viện / 
cơ quan thông tin động viên, giúp đỡ, tạo điều kiện cho họ 
sử dụng những nguồn tin có thông tin cập nhật và đảm bảo 
độ tin cây. 

Giới thiệu các sản phẩm và dịch vụ hiện tại: 

Các cơ quan thông tin / thư viện tiến hành nhiều dịch vụ 
nhằm đảm bảo cho người dùng tin có được thông tin nhanh 
chóng, phù hợp với nhu cầu và lĩnh vực họ quan tâm, các 
loại sản phẩm và dịch vụ thông tin gồm: 

~- Cung cấp danh mục tài liệu / bản sao, 

-_ Biên soạn thư mục, tổng quan vẻ những vấn đề và đề 
tài phù hợp, - 

- Phố biến thông tin chọn lọc. 


- Mượn giữa các thư viện.... 





Đào tạo HgHỜI chừng TÌH 

Cán bộ thông tin / thư viện cung cấp chỉ dân. cách sử 
dụng cơ quan thông tin / thư viện cho bạn đọc / người dùng 
tin cá nhân hoặc tập thể / nhóm. 

Hình thức đào tạo có thể tiến hành tổ chức cho họ theo 
các khoá đào tao khác nhau: theo lớp / nhóm hoặc tiến hành 
cho từng đối tượng sử dụng nguồn tin riêng biệt. Đa số cơ 
quan thông tin / thư viện trực tiếp hướng dân hoặc biên 
soạn. phân phát tờ rơi giới thiệu các nguồn tin, dịch vụ và 
sản phẩm của mình..... 

Về những vấn đề trên, đã và sẽ được đề cập tới ở nhiều 
môn học và trong những giáo trình khác nhau trong chương 
trình đào tạo của ngành. Trong giáo trình này chỉ đi sâu tới 
vấn đề tra cứu thông tin. 

Hiện nay ở Việt Nam thuật ngữ tra cứu thông tin / tra 
cứu tin, tìm tin vẫn chưa có sự thống nhất. Trong các cơ 
quan thông tim thuật ngữ tìm tin được sử dụng tương đối 
thông dụng, còn thuật ngữ tra cứu được sử dụng và quen 
thuộc trong các thư viện từ rất nhiều năm. Trong các giáo 
trình và tài liệu tham khảo của nước ngoài, thuật ngữ tìm tin 
(information retrieval - tiếng Anh; Inforrmatsionnưi poisk - 
tiếng Nga) chủ yếu dùng để chỉ việc tra cứu tự động hoá có 
sử dụng máy tính điện tử, còn việc tra cứu thông tỉn theo 
phương pháp truyền thống, dựa vào các công cụ tra cứu thủ 
công được gọi là công tác tra cứu (Reference work - tiếng 
Anh; Spravochno- Informatsionnala rabota - tiếng Nga). 





Do quá trình dịch và sử dụng thuật ngữ chưa có sự thống 
nhất. Ví dụ: Cùng để chỉ hoạt động tra cứu thông tim trong 
một số tài liệu Anh - Mỹ của các tác giá William À. Kat, 
Mary Gosling,.. dùng thuật ngữ /nƒormaion reirievall hoặc 
Charl T. Meadow, Chñs Grogan dùng Refrence work; Tài 
liệu tiếng Nga của K. B. Taracanov, A. I. Mikhailop, A. I. 
Trernưi, P. C. Giliarevski,.. LhIƒf2matstonnw pOISk hoặc 
trong các tài liệu tiếng Việt cũng sử dụng các thuật ngữ 
khác nhau như: PGS. Đoàn Phan Tân, PGS. Phan Văn, T5. 
Vũ Văn Nhật dùng Tìm tin; các giảng viên chính Trịnh Kim 
Chi, Dương Bích Hồng và nhiều tác giả khác dùng Công tác 
tra cứu,.. Tuy thuật ngữ sử dụng có khác nhau nhưng có 
cùng mục đích là quá trình tìm tin/ tra cứu tài liệu / thông 
tin nhằm đáp ứng nhu cầu tin của người dùng tin. 

Nguyên nhân chính của vấn để chưa thống nhất thuật 
ngữ là chúng ta chưa có từ điển chuyên ngành thông tin - 
thư viện, do đó chưa chuẩn hoá được thuật ngữ. 

Trong giáo trình này chúng tôi sử dụng thuật ngữ tra 
cứu thông tín, song việc sử dụng thuật ngữ trong một số 
trường hợp không thể thống nhất do ngữ cảnh và bản thân 
thuật ngữ đó đã được dùng như vậy trong quá trình tìm tin 
tự động hoá 

Khái niệm về tìm tin! tra cứu thông tin được nhiều tác 
giả đề cập đến. Sau đây là một số định nghĩa: 

- Tra cứu thông tin là tập hợp các công đoạn kỹ thuật và 
logic với các mục đích cuối cùng là tìm được các tài liệu 
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(bản văn), thông tin về chúng hoặc những sự kiện, dữ kiện 
riêng biệt về vấn đề mà người dùng tin cần thiết. 

- Tìm tin hay tra cứu thông tin hay là tập hợp các công 
đoạn có mục đích, nhằm cung cấp cho người dùng tin 
những chỉ dẫn hoặc trả lời câu hỏi đột xuất hay thường 
xuyên của họ. 

- Tìm tin là một quá trình bao gồm những hoạt động 
mang tính logic nhằm mục đích cung cấp cho người dùng 
tin những thông tin phù hợp với yêu cầu của họ theo các 
dấu hiệu đã có. 

- Tìm tin là quá trình so sánh những yếu tố đặc trưng của 
yêu cầu với những yếu tố đặc trưng của tài liệu nằm trong 
hệ thống, nhằm xác định sự tương hợp về nội dung, ý nghĩa 
của các dữ liệu được so sánh và lựa chọn các tài liệu nhằm 
đáp ứng yêu cầu. 

Từ những định nghĩa trên cho thấy các tác giả tương đối 
thống nhất khi xem xét vấn đề tra cứu/ tìm tin. Như vậy, tra 
cứu thông tin là một thuật ngữ chung dùng để phản ánh quá 
trình tra cứu dữ liệu hoặc các nguồn chứa thông tin, trong 
đó có cả các đữ kiện. 

Tra cứu thông tin là quá trình xảy giữa con người và 
mảng tin thông qua các phương tiện, công cụ / hình thức 
lưu trữ thông tin cần thiết khác nhau như hệ thống mục lục. 
các bảng tra cứu, các ấn phẩm thông tin, các bộ phiếu tra 
cứu truyền thống / điện tử, cơ sở dữ liệu.....Đó là những 
công cụ tra cứu thông tin quen thuộc trong các cơ quan 
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thông tin - thư viện. Để tra tìm thông tin cần thiết phải sử 
dụng một. / nhiều ngôn ngữ tìm tin cụ thể, thông qua các 
khoá truy nhập / khoá tra tìm / điểm tiếp cận thông tin. 

Khoá truy nhập / khoá tra tìm / điểm tiếp cận thông tin 
là yếu tố phản ánh những đặc tính khác nhau của đối tượng. 
được sử dụng chơ cả quá trình tra cứu và lựa chọn thông tín. 
Khoá truy nhập bao gồm: 

- Các thuật ngữ phản ánh để mục chủ đề. từ khoá (từ 
chuân) 

- Môn loại các đối tượng nghành (chuyên nghành khoa 
học, loại đơn vị sản xuất kinh doanh, loại đơn vị nghiên cứu 
triên khai....). 

- Thông tin về tác giả, 

- Loại đối tượng tài liệu (tài liệu 1n. CƠ sở dữ liệu....). 

- Thông tin về vùng địa lý / địa danh, 

- Nhân vật, 

- Số liệu, 

- Dữ kiện, 

- Ngôn ngữ, 

- Thời gian....Có liên quan tới đối tượng mà yêu cầu 
hướng tới... 

a 1.2 Các dạng tra cứu thông tín. 

Các dạng tra cứu rất phong phú, chúng được phân chia 
theo nhiều tiêu chí khác nhau như: 
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1.2.1. Dựa vào tính chất thông tin 

Dựa vào tính chất thông tin của đối tượng tra cứu, có thể 
phân chia thành các dạng: 

- Tra cứu thông tin th mục: 

Tra cứu thông tin thư mục là quá trình xác định và tách 
ra khỏi nguồn tra cứu các tài liệu tương ứng với yêu cầu 
thông tin theo các dấu hiệu tìm kiếm cho trước như: tên tác 
giả, tên tài liệu, nơi xuất bản, nhà xuất bản, năm xuất bản, 
số trang, số khổ hay bản sao tài liệu gốc. (Tra cứu theo các 
yếu tố mô tả thư mục). 

Trong hoạt động của các cơ quan thông tin thư viện, việc 
tra cứu thông tin thư mục đã xuất hiện từ rất lâu đời và rất 
quen thuộc với cán bộ thư viện và bạn đọc, đó là hình thức 
cung cấp sách, báo, tạp chí, bản đồ, bản nhạc, tranh ảnh... 
cụ thể hoặc các bản sao của chúng; thông tin về các sáng 
chế phát minh / giải pháp hữu ích / nhãn hiệu công nghiệp / 
tiêu chuẩn / mục lục công nghiệp,... cũng có thể một bài 
trích / câu trích / đoạn trích từ sách, báo, tạp chí cụ thể nào 
đó hay những thông tin về tài liệu như: tác giả, tiêu đề tài 
liệu, lần tái bản, năm xuất bản, số trang,...Cũng có thể là tài 
liệu đã qua xử lí ( mô tả thư mục, tổng luận, dịch, lược 
thuật....). 

Ví dụ: 

* Cho biết tên tác giả của tác phẩm: "Hồ Cẩm Đào - Nhà 
lãnh đạo xuyên thế kỷ của Trung Quốc”? 
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* Trong thư viện có những tài liệu nào đề cập tới "Mi 
học ” xuất bản từ năm 2000 - nay? 

* Tài liệu “Thông tin học” của những tác giả nào? Xuất 
bản vào những năm nào?.... 

- Tra cứu thông tin dữ kiện: 

Tra cứu thông tin đữ kiện là tìm các số liệu, dữ kiện có 
trong bản thân tài liệu (hoặc tập hợp các tài liệu). Hiểu một 
các khác, đó là quá trình xác định và tách ra khỏi nguồn tin 
những số liệu, dữ kiện cụ thể như: 

+ Đặc tính, tính chất, thông số kĩ thuật của các thiết bị, 
máy móc, 

+ Tính chất của vật, vật liệu, 

+ Hàng số vật lý, hoá học, 

+ Công thức của một chất / hợp chất hoá học, 

+ Số liệu thống kê, 

+ Các khái niệm khoa học.... 

Với sự phát triển không ngừng của nguồn thông tin cấp 
1, trong điều kiện các đối tượng cần xử lý thông tin được 
mở rộng, đặc biệt nhu cầu người dùng tin đời hỏi cần được 
cung cấp sản phẩm được tạo nên trên cơ sở xử lý sâu vào 
nội dung thông tin của nguồn tin, đó là thông tin dữ kiện. 
Thông tin dữ kiện là các thông tin cụ thể. chỉ tiết về đối 
tượng, các thông tin này được thể hiện dưới hình thức các 
dữ kiện. 
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Với nền kinh tế mở, nhiều thành phần, các cơ quan 
thông tin- thư viện, đặc biệt là các cơ quan tư vấn thông tin, 
trung tâm thông tin hành chính, thông tin thương mại, 
thông tin kinh tế -xã hội,.. rất quan tâm tới hoạt động thông 
tin đữ kiện. Các cơ quan này đã tạo nên các nguồn thông tin 
dữ kiện hết sức đa dạng và phong phú, đồng thời cũng là 
những người dùng tin đữ kiện mạnh nhất. Trong quá trình 
tra cứu thông tin dữ kiện, dựa vào các yếu tố khác nhau: 
mục đích sử dụng thông tin, đặc tính của dữ kiện được lưu 
trữ để đáp ứng yêu cầu của nhiều đối tượng thông qua các 
công cụ, phương tiện khác nhau như hộp phiếu tra cứu dữ 
kiện, kho tài liệu tra cứu truyền thống / điện tử, CSDL dữ 
kiện,... 

Ví dụ: 

* Năm 2002 các trường trung học cơ sở ở Việt Nam xây 
dựng được bao nhiêu phòng học? 

* Nhiệt độ lạnh nhất của Sa pa là bao nhiêu? Những năm 
nào có tuyết rơi trong I0 năm trở lại đây? 

* Có bao nhiêu đại biểu chính thức tham gia Đại hội 
Đảng lần thứ 3? 

* Thủ tướng Thái Lan năm 1997 là ai?,.. 

Sự giống nhau và khác nhau giữa tra cứu thông tin thư 
mục và tra cứu thông tin dữ kiện: 

Giống nhau: 


- Về nguyên tắc tra cứu. 
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- Về phương pháp tra cứu. 

Khác nhau: 

- Về nội dung đối tượng tra cứu. 

+ Tra cứu thư mục: Tìm tài liệu hay thông tin về đối 
tượng/Tài liệu đó. | 

+ Tra cứu đữ kiện: Tìm thông tin được phản ánh có trong 
tài liệu/tập hợp tài liệu. 

1.2.2. Dựa vào công cụ ra Cứ Các hình thức lưu trữ 
thông tìm. 

Công cụ tra cứu/ Nguồn tìm / Bộ máy tra cứu - Đó chính 
là những nguồn thông tin cấp hai giúp người dùng tin có 
khả năng tiếp cận tới nguồn thông tin cấp một. Các công cụ 
tra cứu được lưu trữ bảng các hình thức khác nhau như: hình 
thức lưu trữ thông tín truyền thống (thủ công), hình thức lưu 
trữ thông tin tự động hoá và hình thức lưu trữ thông tin bán 
tự động hoá. Dựa vào các công cụ tra cứu, có các loại cụ thể 
sau: 

- Tra cứu thông tín truyền thống thui công: Là quá trình 
tra cứu được thực hiện thông qua hệ thống tra cứu truyền 
thống/ thủ công như: 

+ Hệ thống mục lục: 

Mục lục chữ cái 

Mục lục phân loại 


Mục lục chủ đề,.. 
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+ Hộp / bộ phiếu tra cứu: 

Hộp / bộ phiếu tra cứu dữ kiện, 

Hộp / bộ phiếu tra cứu chuyên đề,.. 

+ Ấn phẩm thông tin - thư mục: 

Bản thư mục, 

Tạp chí tóm tắt, 

Thư mục trích dẫn tạp chí khoa học, 

Danh mục tài liệu,.. 

+ Tài liệu tra cứu: 

Bách khoa thư tổng hợp / chuyên nghành / chuyên đề 

Các loại từ điển, 

Số tay tra cứu, 

Niên giám, 

Niên biểu,... 

- Tra cứu thông tin tự động hoá: 

Tra cứu thông tin tự động hoá còn được gọi là tìm tin tự 
động hoá. Tìm tin tự động hoá là quá trình sử dụng máy 
tính điện tử và/hoặc mạng máy tính để tìm các thông tin 
máy tính đọc được, được lưu trữ trên bộ nhớ của máy tính 
hoặc các thiết bị lưu trữ thông tin điện tử khác và thường 
được tổ chúc dưới hình thức cơ sở đữ liệu. 

Tìm tin tự động hoá còn có thể gọi là tìm tin tin học hoá 
hoặc tìm tin theo chế độ đối thoại bởi đặc trưng rất quan 
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trọng của tìm tin tự động hoá là việc lưu trữ và tìm kiếm 
thông tin được tiến hành trên cơ sở hệ thống tìm tin có các 
phương tiện tin học và với sự đối thoại giữa người tìm tin và 
hệ thống tìm tin. Bộ máy tra cứu trong tìm tin tự động hoá 
là các cơ sở dữ liệu. 

Cơ sở dữ liệu có thể được chia thành: 

- Cơ sở dữ liệu thư mục; 

- Cơ sở đữ liệu dữ kiện; 

- Cơ sở đữ liệu toàn văn: Bách khoa thư, từ điển, sổ tay 
tra cứu,.. 

Bản thân tìm tin tự động hoá có thể được chia thành các 
dạng tìm tin khác nhau. 

Sự phân loại chỉ tiết đạng tìm tin tự động hoá được trình 
bày trong Chương IV: Tìm tin tự động hóa. 

- Tìm tin bán tự động hoá: 

Phiếu lỗ mép, 

Phiếu lỗ soi. 

Tuy nhiên, trong thời kỳ công nghệ thông tin và viễn 
thông phát triển một cách mạnh mẽ và được ứng dụng rộng 
rãi trong tất cả các lĩnh vực hoạt động, các phương tiện tra 
cứu bán tự động được tồn tại như một công cụ mang tính 
lịch sử. 

Hiện nay, hầu hết các thư viện và các cơ quan thông tin 
sử dụng phương tiện tra cứu truyền thống hoặc sử dụng 


26 





song song với phương tiện tra cứu tự động hoá. Đối với các 
cơ sở dữ liệu / ngân hàng đữ liệu tuy mới phát triển trong 
gần ba, bốn thập kỷ nhưng đã khẳng định được tính ưu việt 
của mình (mỗi năm tăng trưởng vào khoảng 25%). Tại các 
thư viện lớn trên thế giới việc tra cứu thông tin được tiến 
hành chủ yếu bằng phương tiện tự động hoá. 

1.2.3. Dựa vào hình thức xứ lý 

Trong quá trình hoạt động, các cơ quan thông tin - thư 
viện đã sử dụng nhiều hình thức để xử lí thông tin khác 
nhau như: xử lí hình thức, xử lí nội dung, đó là: mô tả thư 
mục, phân loại tài liệu, làm tóm tắt, chú giải, làm tổng luận, 
tổng quan, lược dịch tài liệu,... 

Trên cơ sở các hình thức xử lí có thể chia các loại tra cứu 
thành: 

- Tra cứa theo dấu hiệu hình thức của tài liệu: việc tra 
cứu được thực hiện theo các yếu tố: 

+ Tên tác giả / Dịch giả / Người chủ biên / Người sưu 
tầm / Người hiệu đính,.. 

+ Tiêu đề tên tài liệu, 

+ Theo các yếu tố xuất bản (Nơi xuất bản, nhà xuất bản, 
năm xuất bản, số trang, số khổ, giá tiền,...) 

Ví dụ: 

- Ai là người dịch cuốn “Chiến quốc sách trong kinh 
doanh"? hoặc: 


- Ái là người sưu tầm và biên soạn cuốn "Trò chơi ảo"? 
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`~ ra cứu theo dấu hiệu nội dung: 

Mỗi cơ quan thông tin - thư viện tuỳ thuộc vào quy mô 
cũng như điều kiện cơ sở vật chất - kỹ thuật cụ thể hiện có 
của mình để tiến hành xử lí nội dung tài liệu. Trên cơ sở kết 
quả của quá trình mô tả nội dung tài liệu: kí hiệu phân loại, 
chủ đề, từ khoá. Tra cứu theo nội dung tài liệu / thông tin có 
thể được tiến hành: 

+ Theo các môn ngành khoa học/ Lĩnh vực tri thức: về 
Toán học; Thiên văn học; Điện tử - viễn thông; Ngôn ngữ 
học... 

+ Theo đề mục chủ đề: Di tích văn hoá; Tiêu hoá, Cây 
công nghiệp; Giáo dục,,.. 

+ Theo từ khoá: Ăn mòn; Tín ngưỡng; Máy điện; Hạ 
long; ¿ 

1.2.4. Dựa vào ngôn ngữ tài liệu. 

Các thư viện và cơ quan thông tin thường bổ sung tài 
liêu được xuất bản bằng nhiều ngôn ngữ khác nhau trên thế 
giới, do đó khi tra cứu cần tìm hiểu người dùng tin cần tài 
liệu bằng những loại ngôn ngữ nào để đáp ứng yêu cầu. 

Ví dụ: Họ cần tài liệu bằng tiếng Lào ; tiếng Nga; tiếng 
Nhật; tiếng Á rập: tiếng La tỉnh (Anh,'Pháp...)... 

1.2.5. Dựa vào thời gian xuất bản của tài liệu 

Trong quá trình tra cứu thông thường người dùng tin cần 
những thông tin cập nhật qua các nguồn tài liệu mới được 
xuất bản, phân ánh trình độ phát triển của ngành, lĩnh vực, 
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vấn đẻ họ quan tâm. Tuy nhiên không ít trường hợp người 
dùng tin quan tâm tới những tài liệu được xuất bản trước đó 
(trong các thời kì khác nhau của lịch sử) hoặc sẽ xuất bản 
trong thời gian tới. Như vậy dựa vào thời gian xuất bản của 
tài liệu ta có thể có các dạng tra cứu: 

- Tra cứu thông tin hồi cố (Tài liệu xuất bản trong 
khoảng thời gian nhất định nào đó đã qua). 

Ví dụ: Các tài liệu về Y học cổ truyền bằng chữ nôm 
xuất bản trong thời kì Pháp thuộc 

- Tra cứu thông tin hiện tại/ hiện thời (Tài liệu mới đang 
phát hanh hoặc đã được phát hành đã qua trong thời gian 
ngắn). 

Ví dụ: Các tài liệu về hán quyển ở Việt Nam xuất bản 
từ năm 2000 đến nay. 

- Tra cứu thông tin đự báo (Tài liệu sẽ phát hành trong 
thời gian tới). 

Ví dụ: Các tài liệu về /ch sử sẽ xuất bản năm 2005. 

!.2.6. Dựa vào loại hình tài liệu 

Trong thời kì khoa học - công nghệ phát triển rất mạnh 
mẽ dàn tới bùng nổ thông tin. các loại hình tài liệu được 
xuât bản rất phong phú cả vẻ nội dung cũng như hình thức, 
đặc biệt là tài liệu khoa học và công nghệ. Ngoài các tài 
liệu thông thường dạng giấy như sách, báo, tạp chí phản ánh 
nhiều vấn để liên quan tới khoa học cũng như đời sống xã 
hội. còn có những loại hình tài liệu / thông tin đặc biệt như: 
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Mô tả sáng chế phát minh, mô tả các giải pháp hữu ích, tài 
liệu tiêu chuẩn - đo lường - chất lượng, mục lục công 
nghiệp (catalo công nghiệp),..Còn nhiều loại tài liệu dưới 
đạng vi phim, vị phiếu, tài liệu dứơi dạng điện tử cũng ngày 
càng xuất hiện nhiều hơn và trở nên quen thuộc, thân thiện 
hơn với người dùng tín. Trong quá trình tra cứu thông tin có 
thể tra cứu theo loại hình tài liệu riêng biệt. 

Ví dụ: - Các tiêu chuẩn về xuất khẩu hải sản đóng lạnh 
ban hành năm 2000 - 2003, hoặc: 

- Các văn bằng sáng chế phát minh về Lò điện đã được 
cấp năm 2000 - 2003. ' 

Trên thực tế, để tra cứu thông tin được nhanh chóng, 
chính xác và đầy đủ, khi thực hiện quá trình tra cứu không 
thể chỉ dựa vào một, hai dạng tra cứu riêng biệt, mà chủ yếu 
là phải phối hợp nhiều dạng tìm với nhau. 

Ví dụ: Để tra cứu một vấn đề cụ thể, khi sử dụng bộ máy 
tra cứu cần kết hợp các công cụ tra cứu truyền thống với các 
công cụ tra cứu tự động hoá; tra cứu các tài liệu như: sách, 
báo, tạp chí; bằng nhiều loại ngôn ngữ khác nhau; thời gian 
xuất bản tài liệu phù hợp với yêu cầu tin,... 

Một trong những yếu tố góp phần đảm bảo cho việc tra 
cứu thành công và thông tin phù hợp với yêu cầu tin của 
người dùng tin là người tìm tin phải rất linh hoạt, am hiểu 
nguồn lực thông tin của cơ quan, có trình độ chuyên môn, 
nghiệp vụ, có trình độ ngoại ngữ, đặc biệt phải biết sử dụng 
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thông thạo máy tính để có thể khai thác được các cơ sở dữ 
liệu và nhiều nguồn tin trên các mạng. 

Nếu chỉ dựa vào một, hai tiêu chí để tra cứu, kết quả 
trong nhiều trường hợp sẽ không đầy đủ, như vậy sẽ không 
đáp ứng yêu cầu tin của người dùng tin. 


2. HỆ THỐNG TRA CỨU THÔNG TIN 

Hệ thống tra cứu thông tin là một tập hợp các yếu tố và 
phương tiện dùng để lưu trữ và tra cứu tài liệu/ thông tin về 
chúng hoặc những sự kiện, dữ kiện riêng biệt. 

Để thực hiện bất kì một đạng tra cứu thông tin nào trong 
thành phần của hệ thống cũng bao gồm 4 yếu tố cơ bản sau: 

- Ngôn ngữ tìm tin, 

- Bộ mấy tra cứu, 

- Yêu cầu tin, 

- Con người. 

Các yếu tố cơ bản trên của hệ thống có mối quan hệ mật 
thiết, tác động qua lại lẫn nhau, mặt khác có chức năng 
riêng và tạo nên hệ thống. Chúng ta đi sâu nghiên cứu các 
yếu tố đó. 

ñ 2.I. Ngôn ngữ tìm tín. 

Ngôn ngữ tìm tin là cơ sở để tạo ra các mẫu tìm. Mẫu 
tìm là nội dung, ý nghĩa cơ bản của yêu cầu thông tin được 
diễn đạt bằng những thuật ngữ của ngôn ngữ tìm tin. Nội 
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dung này phù hợp với một tài liệu nào đó và dùng nó trong 
tập hợp nhiều tài liệu khác. 

2.1.1. Các khái niệm cơ bản về ngôn ngữ tÌm tin 

Nhu cầu về sử dụng tài liệu của người đùng tin luôn phát 
triển cùng với sự phát triển văn hoá. kinh tế, khoa học và kỹ 
thuật. Nhu cầu khai thác, sử dụng tài liệu/ thông tin không 
chỉ giới hạn trong phạm vi một vùng. mội đất nước thông 
qua việc trao đổi tài liệu, giao lưu giữa các tổ chức. các cơ 
quan khoa học, viện nghiên cứu, trường đại học. các thư 
viên và các cơ quan thông tin trên phạm vị thế giới. 

Để người dùng tin khai thác được những thông tin cần 
thiết, có ích chứa trong tài liệu, các cơ quan thông tin- thư 
viên phải tổ chức tốt các hoạt động của mình, trong đó có 
việc xây dựng và áp dụng các ngôn ngữ tìm tin phù hợp. 

Do những đặc trưng của ngôn ngữ tự nhiên: tổn tại song 
song nhiều ngôn ngữ, khác nhau vẻ cấu trúc ngữ pháp, ngữ 
nghĩa phức tạp, đa dạng nên không thể dùng chúng để xử lý 
nội dung tài liệu và tra cứu về chúng. Đòi hỏi phải xây dựng 
ngôn ngữ chuyên dụng để xử lý, tổ chức các hình thức lưu 
trữ thông tin và tra cứu thông tin. Đó là ngôn ngữ nhân tạo 
chuyên dụng - Ngôn ngữ tìm tín. 

Ngôn ngữ tìm Iin là ngôn ngữ nhân tạo ddO COH HHỜI qHy 
ước và xây dựng dùng để diễn đạt nội dụng, Š nghĩa cơ bản 
của yêu cẩu tín, thể hiện bằng một! một số tàt liệu thông 
tin nào đó đáp ứng yêu cầu tin đặt ra, được luat trữ bằng 
các hình thức khác nhau. 
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Các khái niệm trên được nhiều tài liệu đề cập và đưa ra 
nhiều định nghĩa với các thuật ngữ khác nhau (Cũng giống 
như thuật ngữ tìm tin). 

Sau đáy là một số định nghĩa về ngôn ngữ tìm tín. 

- Ngôn ngữ tìm tin! ngôn ngữ tư liệu là phương tiện để ghi 
lại một cách cô đọng, có khả năng diễn đạt những khía cạnh 
chủ yếu của nội dung tài liệu và yêu cầu tin, được đánh chỉ 
số hoặc mã hoá theo một hệ thống thích hợp. Khi mã hoá, 
tin cơ bản nhất chứa trong tài liệu có thể tìm được dễ đàng 
hơn so với tin thứ yếu. 

- Ngôn ngĩ đánh chỉ số (Index language) là ngôn ngữ 
tập hợp toàn bộ các thuật ngữ đánh chỉ số được sử dụng 
trong hệ thông tìm tin (các bảng phân loại). 

- Ngôn ngữ tư liệu (Language docHmentation) là một hệ 
thống các dặc trưng dùng để đánh chỉ số các tài liệu, là 
phương tiện liên lạc phục vụ cho việc giao tiếp giữa người 
dùng tin với tài liệu. 

- Ngôn ngữ tìm tin (Retrieval language) là ngôn ngữ 
nhân tạo, các từ của nó là các con số chỉ các khái niệm đã 
được hệ thống hoá, còn cú pháp phản ánh những quan hệ 
ngữ nghĩa giữa các khái niệm đó,.. 

Tuy nhiên. qua các định nghĩa trên ta thấy có sự chưa 
thống nhất trong khi sử dụng thuật ngữ - Theo lí giải ở trên 
do chưa có từ điển thuật ngữ chuyên ngành. Ngôn ngữ tìm _ 
tin là thuật ngữ được thay đổi tuỳ thuộc vào mục đích sử 
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dụng của nó. Song qua các định nghĩa có sự thống nhất đó 
là ngôn ngữ tìm tin là ngôn ngữ nhân tạo chuyên dụng diễn 
đạt nội dung, ý nghĩa cơ bản của tài liệu và phương tiện để 
tìm kiếm thông tin. Ở môn học “Mô td nội dung tài hiệu” 
chúng ta đã có dịp làm quen với ngôn ngữ tư liệu. Tuy 
nhiên không ít người chưa hoàn toàn phân biệt được sự 
giống nhau và khác nhau của ngôn ngữ tìm tín và ngón ngữ 
tư liệu. 

Ngôn ngữ tìm tin và ngôn ngữ tư liệu giống nhau: Chúng 
đều là ngôn ngữ nhân tạo chuyên dụng. Cơ sở để mô tả nội 
dung tài liệu và cũng là cơ sở để tìm tín. 

Khác nhau: 

- Ngôn ngữ tư liệu: diễn đạt nội dung, ý nghĩa cơ bản của 
tài liệu 

- Ngôn ngữ tìm tin: diễn đạt nội dung, ý nghĩa cơ bản 
của yêu cầu tin : 

Khi cơ quan thông tin - thư viện sử dụng loại ngôn ngữ 
tư liệu cụ thể nào để xử lý nội dung tài liệu, thì khi thể hiện 
yêu cầu tin cũng được dùng chính loại ngôn ngữ đó. Như 
vậy là sự khác nhau của ngôn ngữ tư liệu và ngôn ngữ tìm 
tin chỉ ở mục đích sử dụng những loại ngôn ngữ đó. 

Trong quá trình xử lý tài liệu tuỳ thuộc vào mục đích và 
yêu cầu của thư viện và cơ quan thông tin, cán bộ xử lý tiến 
hành quá trình phân tích tài liệu và thể hiện bảng những 
hình thức trình bày của ngôn ngữ tư liệu. Về bản chất các 
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ngôn ngữ tư liệu được sử dụng nhằm mục đích là nhóm các 
tài liệu cùng thể hiện một nội dung vào một nhóm chung có 
cùng dấu hiệu đồng thời tuỳ theo những đặc điểm cụ thể mà 
phân nhỏ nội dung của tài liệu ra nhiều góc độ khác nhau. 
Kết quả của quá trình xử lý nhằm mục đích để tổ chức các 
hình thức iưu trữ thông tin (xây dựng bộ máy tra cứu) khác 
nhau: xáy dựng ngôn ngữ Tìm tin trong các cơ sở dữ liệu, 
xây dựng các bảng tra cứu trong các ấn phẩm thông tin, tổ 
chức mục lục phân loại và mục lục chủ để. Các ngôn ngữ 
tìm tin được xây dựng để tạo nên bộ máy tra cứu linh hoạt, 
có độ tin cậy cao đáp ứng nhu cầu tra tìm thông tin. Ngoài 
ra trong một số trường hợp ngôn ngữ tìm tin còn được chú ý 
đến khi tổ chức các kho mở và khi biên soạn thư mục. Hiện 
nay có 3 nhóm ngôn ngữ tìm tin chính đang được sử dụng 
rộng rãi ở các thư viện và cơ quan thông tin là: 

- Ngôn ngữ tìm tin theo kí hiệu phân loại (Ngôn ngữ tìm 
tin theo hệ thống đẳng cấp). 

- Ngôn ngữ tìm tin theo đề mục chủ đề. 

- Ngón ngữ tìm tin theo từ khóa, từ chuẩn. 

Ngôn ngữ tìm tin giúp cho việc thể hiện yêu cầu tin và 
tìm tin. Ngôn ngữ tìm tin sử dụng để ra cứu thông tin theo 
nội dung. Có thể thực hiện việc tìm tin truyền thống cũng 
như tìm tin tự động hoá. 

Dù có chung một mục đích, mỗi loại ngôn ngữ tìm tin có 
những ưu thế, đặc điểm riêng. Chúng ta đi sâu nghiên cứu 
một số loại ngôn ngữ tìm tin chính. 
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2.1.2. Ngôn ngữ tìm tin theo kí hiện phán loại 

Ngôn ngữ tìm tin theo kí hiệu phân loại hay còn gọi là 
ngôn ngữ tìm tin theo môn ngành tri thức / theo đẳng cấp hệ 
thống. 

Ngôn ngữ tìm tin theo kí hiệu phân loại: là loại ngôn ngữ 
tìm tin cổ nhất và được áp dụng rất rộng rãi (có thể xếp thứ 
nhất trong các ngôn ngữ tìm tin) ở các thư viện và cơ quan 
thông tin. Cơ sở để phân loại tài liệu cũng như xây dựng bộ 
máy tra cứu và thể hiện yêu cầu tin là các bảng phân loại. 
Các bảng phân loại là ngôn ngữ tiền kết hợp, có nghĩa là 
các kí hiệu phân loại đã được xác định đồng thời cùng với 
việc xây dựng các bảng phân loại. 

Việc phân chia các môn ngành tri thức/ïnh vực khoa học 
trong từng bảng phân loại phụ thuộc vào quan điểm và cách 
phân định của người biên soạn. Theo cấu trúc của các bảng 
phân loại, trong từng môn loại lớn lại có sự phân chia chỉ 
tiết theo đẳng cấp. Quan hệ thứ bậc là loại quan hệ cơ bản 
đóng vai trò quyết định trong hệ thống phân loại, do đó khi 
áp dụng việc xây dựng mục lục phân loại, chúng ta sẽ có 
một hệ thống các dấu hiệu tìm tin theo sơ đồ hình cây. 

Hiện nay trên thế giới, tồn tại song song nhiều bảng 
phân loại khác nhau. Trong một cơ quan thông tin - thư viện 
cũng không hiếm nơi đồng thời sử dụng nhiều bảng phân 
loại khác nhau. 
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Điểm qua một số bảng phân loại phổ biến nhất hiện nay. 

Bảng phân loại thập tiến Dewey (DDC) 

Bảng phân loại thập tiến Dewey (Dewey Decimal 
Classification - DĐC) ra đời năm J876 do nhà thư viện học 
nổi tiếng người Mỹ Melvin Dewey (1851- 1931) soạn thảo. 
Bảng phân loại Dewey ra đời do nhu cầu của công tác tổ 
chức kho sách và công tác thư mục ở Mỹ lúc bấy giờ, nhằm 
phục vụ kịp thời cho sự phát triển mạnh mẽ của khoa học 
kỹ thuật và nền sản xuất lớn tư bản ở thế kỷ XIX. 

Cấu trúc của bảng phân loại Dewey 

Bảng phân loại Dewcy gồm 10 lớp cơ bản, ký hiệu bàng 
3 chữ số từ 000 - 900 xếp theo thứ tự như sau: 

000 Tổng loại 

100 Triết học 

200 Tôn giáo 

300 Khoa học xã hội 

400 Ngôn ngữ 

300 Khoa học tự nhiên 

600 Khoa học ứng dụng 

700 Nghệ thuật- thể thao 

800 Văn học 

900 Địa lý- lịch sử 

Mỗi lớp cơ bản lại chia thành 10 lớp con, mỗi lớp con 
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chia thành nhiều lớp nhỏ và cứ thế tiếp tục, như vậy sự phân 
chia được tiến hành theo quy tắc thập tiến. 

Ví dụ: 

500 Khoa học tự nhiên 

310 Toán học 

320 Thiên văn học 


390 Động vật học. 

Mục 510 

5II Toán học 

312 Đại số học đại cương 

312.1 

312.2... 

513 Số học 

519 Xác xuất và toán học ứng dụng. 

Bảng phân loại Dewey được xuất bản lần đầu 1876 và 
được tái bản nhiều lần có bổ sung và mở rộng. Hiện nay có 
trên 30.000 mục. Bảng phân loại này được sử dụng rộng rãi 
tại nhiều thư viện ở Mỹ và một số nước ở châu Âu và là một 
trong ba bảng phân loại thông dụng nhất trên thế giới. DDC 
có nhiều ưu thế và được cập nhật tương đối kịp thời. Hiện 
nay DDC được qui định dùng cho hệ thống OCLC và đang 
rất được quan tâm ở Việt Nam. 
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Báng phân loại thập tiến quốc tế UDC 

Bảng phân loạt thập tiến quốc tế UDC (Universal 
Decimal Clasification) ra đời từ năm 1907 do Liên đoàn 
Tư liệu Quốc tế (FID) biên soạn. ƯDC được xây dựng trên 
cơ sở của bảng phân loại DDC và mở rộng (mục kỹ thuật 
điện tử, kỹ thuật vũ trụ....). UDC còn có thêm những quy 
định mới, nguyên tắc mới về phương pháp liên kết ký hiệu, 
nhằm tạo điều kiện cho việc cho việc phân loại những tài 
liệu có nội dung phức tạp. 

Ngài ra, UDC còn có một hệ thống bảng phụ phong phú 
để bổ sung cho bảng chính. 

Cấu trúc của UDC 

Bảng chính: 

0. Những vấn đề chung 

1. Triết học. 

2. Tôn giáo. 

3. Các khoa học xã hội. Luật pháp. Quản lý. 


4. Ngôn ngữ 

5. Khoa học tự nhiên 

6. Khoa học ứng dụng. kỹ thuật. Y học 

7. Nghệ thuật. Nghệ thuật ứng dụng. Thể thao 
8. Văn học. Tác phẩm văn học. 

9, Địa lý. Lịch sử. Tiểu sử. 





Tiếp theo dãy cơ bản là những lớp nhỏ hơn được sắp xếp 
theo một trật tự nhất định, đánh số theo nguyên tác thập 
phân. Trật tự các lớp đó phản ánh mối liên hệ giữa chúng 
theo nguyên tắc từ chung đến riêng. 

Ví dụ: 

5. Khoa học tự nhiên. 

50 Những vấn đề chung về toán học và khoa học tự 
nhiên. 

3] Toán học. 

52 Thiên văn học. 


39 Động vật học. 
Mục 54: Hoá học. 

547 Hoá học hữu cơ. 

347.2 Những hợp chất hữu cơ không vòng. 

547.2 Hydro cacbon. 

347.211 Metan. 

Các bảng phu: 

- Bảng phụ hình thức: Phản ánh những khía cạnh hình 
thức của tài liệu, công dụng của tài liệu như: tài liệu nghiên 
cứu, sách giáo khoa. Trợ ký hiệu hình thức được viết trong 
ngoặc đơn với số Ö đứng trước (0....) 

(031) Bách khoa thư. 
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622 (031) Bách khoa thư về ngành mỏ. 

(071) Sách giáo khoa. 

512 (071) Sách giáo khoa về số học. 

Trong trường hợp cần tập hợp những tài liệu có cùng 
hình thức xuất bản vào một chỗ chỉ cần chuyển trợ ký hiệu 
lên trước: 

Ví dụ: 

(075) 512 - Sách giáo khoa về số học. 

(075) 54 - Sách giáo khoa về hoá học. 

- Bảng phụ địa lý: Phản ánh những khía cạnh địa điểm 
địa lý được đề cập đến trong tài liệu, đó là các vùng địa lý 
tự nhiên các quốc gia. sông, núi, biển hồ, đại dương,.. Mỗi 
khái niệm địa lý có một trợ kí hiệu độc lập, viết trong ngoặc 
đơn, giống như trợ ký hiệu hình thức nhưng không có số Ö 
đứng trước. 

(4) Châu Âu 
(44) Nước Pháp 
(5) Châu Á 
(597) Việt Nam. 

Cũng như trợ kí hiệu hình thức, trợ kí hiệu địa lý có thể 
viết trước ký hiệu chính, trong trường hợp cần sắp xếp tài 
liệu theo từng vùng địa lý. 

Tài liệu bảng phụ dân tộc giống với trợ kí hiệu ngôn ngữ 
nhưng để trong ngoặc đơn 
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(= 20) Dân tộc Anh 
(= 40) Dân tộc Pháp 
- Bảng phụ thời gian: Phản ánh những khía cạnh về thời 
gian: thời đại, thế kỷ, năm tháng,... kí hiệu thời gian được 
thể hiện bằng chữ số Á rập viết trong ngoặc kép. 
Thế kỷ thứ I "00" 
Thế kỷ thứ 2 "02" 
Năm 1975 "1975" 
Năm 250 "0250" 
Ngày 02 tháng 09 năm 1945: "1945.09.02" 
Thời gian trước công nguyên có thêm (-) đứng trước. 
Thế kỷ thứ 2 trước công nguyên: "- 2" 
Ngoài ra trong UDC còn sử dụng các dấu. 
Đấu quan hệ (hai chấm:) 
Dấu kết hợp (dấu +) 
Dấu mở rộng (gạch chéo /).... 
Có các công dụng như trong các bảng phân loại khác. 
Bảng phân loại Thư viện - Thư mục Xô viết (BBK) 
Bảng phân loại Thư viện - thư mục Xô viết (BBK) ra đời 
năm 1960 đáp ứng nhu cầu từ lâu của các thư viện Xô-Viết 
cần có một bảng phân phân loại phù hợp với nên khoa học 
kỹ thuật hiện đại, với nên kinh tế và văn hoá xã hội chủ 
nghĩa. 
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Bảng phân loại BBK được xây dựng trên cơ sở phân loại 
khoa học của Anghen. Ngoài ra, các nhà biên soạn còn dựa 
trên một số yêu cầu cơ bản sau đây: 

Nội dung của bảng phải phản ánh được trình độ phát 
triển của khoa học kỹ thuật hiện đại và tình hình chính trị, 
xã hội hiện tại. 

Cấu trúc của bảng mềm dẻo, có tính co dãn và có khả 
năng phát triển: phản ánh được các ngành khoa học mới; 
thuận tiện cho việc tra cứu thông tin truyền thống, cũng như 
tra cứu tự động hoá. Bảng phân loại BBK đã được dịch sang 
tiếng Việt và được sử dụng ở một số thư viện lớn như: Thư 
viện Khoa học và Kỹ thuật Trung ương, Viện Thông tin 
Khoa học Xã hội, Thư viện Quốc gia Việt Nam và nhiều 
thư viện khác. 

Cấu trúc của BBK 

- Dãy cơ bản BBK gồm 28 lớp chính ký hiệu bằng chữ 
cái Nga, đã chuyển sang chữ cái Việt (A - Z. ). 

A - Chủ nghĩa Mác - Lênin. 

B - Khoa học tự nhiên nói chung. 

C - Khoa học toán lý. 

D - Hoá học. 

Z - Những tài liệu có nội dung tổng hợp. 

Các dãy cơ bản có thể chia thành 6 nhóm chính. 


43 











Nhóm I: A. Chủ nghĩa Mác - Lênin. 

Nhóm 2: Các nhóm khoa học tự nhiên gồm 

C/E 

Nhóm 3: Khoa học ứng dụng. 

Nhóm 4: Khoa học xã hội. 

O/W 

Nhóm 5: Khoa học ứng dụng về con người 

xi 

Nhóm 6: Z. Tài liệu có nội dung tổng hợp 

Tiếp theo dãy cơ bản là lớp nhỏ hơn - được xếp theo 
nguyên tắc từ chung đến riêng, từ lý thuyết đến thực hành. 


Các lớp tiếp theo là chữ số ả rập đánh số theo nguyên tắc 
thập phân. 


E0 Sinh vật học đại cương 

EL Cổ sinh vật học 

E4 VI sinh vật học 

E9 Lý sinh học. Hoá sinh học. Sinh lý học động vật và 
npười. 

E91 Lý sinh học. Hoá sinh học. Sinh lý học của hệ tim 
mạch và máu 

E92 Lý sinh học. Hoá sinh học. Sinh lý học các cơ quan 
hô hấp 
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E 99 Lý sinh học. Hoá sinh học. Sinh lý học hệ thần kinh 
Và Cơ quan cảm giác 

E991 

E992... 

Bảng phụ (bảng mẫu) 

- Bảng mẫu chung: phản ánh những khía cạnh phụ của 
tài liệu được lặp đi lặp lại ở hầu hết các ngành khoa học. 
Bảng mẫu chung được ký hiệu bằng chữ á rập theo nguyên 
tắc thập phân và được ghép với ký hiệu chính bằng dấu 
ngăn cách chấm (.) 

Ví dụ: 

D.d: Lịch sử hoá học. 

ĐI2d: Lịch sử phát minh các nguyên tố hoá học. 

- Bảng mẫu riêng và bảng sắp xếp. 

+ Bảng mẫu riêng: dùng để phối hợp với bảng chính của 
từng lĩnh vực khoa học riêng lẻ, phản ánh những khái niệm 
được lập đi lập lại trong từng lĩnh vực cụ thể. Trong BBK có 
hơn 130 bảng mẫu riêng ký hiệu bằng chữ số ả rập nối liền 
với khoa học chính bảng dấu gạch ngang (-) 

+ Bảng sắp xếp: 1 dùng của bảng mẫu riêng dùng để chỉ 
tiết hoá các mục của mội số ngành 

- Bảng mâu địa lý: Giống như ƯDC. 

- Các dấu dùng trong BBK: Giống như ƯDC. 
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Bảng phân loại của Thư viện Quốc hội Mỹ - LCC 

Bảng phân loại của Thư viện Quốc hội Mỹ LCC 
(Library of Congress Classification) được xuất bản năm 
1897 trên cơ sở bảng phân loại Cutter (Charler Ammi). 


Bảng phân loại này sử dụng chữ cái in ở dây cơ bản \ và 
lớp 2 bằng chữ Latinh. 

Cũng như các bảng phân loại đã nghiên cứu ở trên, LCC 
có hệ thống bảng bổ trợ kí hiệu rất phát triển, ngoài ra trong 
bảng phân loại còn tồn tại các bảng trợ kí hiệu địa lý, ngôn 
ngữ, dân tộc.... và bảng trợ ký hiệu phối hợp. 

Trên thế giới vẫn còn tồn tại một số bảng phân loại khác 
như Bảng phân loại của Ranganathan ở Ân Độ, hay tại một 
số nước dựa vào bảng phân loại UDC, hoặc bảng phân loại 
Dewey để biên soạn các bảng phân loại cho thư viện của 
mình. Ví dụ: Bảng phân loại dùng cho các thư viện khoa 
học tổng hợp (Thư viện Quốc gia Việt Nam) xuất bản năm 
1969, 1991, 2002. 

Như vậy, muốn tra cứu thông tin theo môn ngành tri thức 
một cách chính xác, đây đủ, ta không chỉ quan tâm tới các 
kí hiệu chính, mà cần phải chú ý tới các rrợ kí hiệu như: Trợ 
kí hiệu hình thức,; trợ kí hiệu địa lí; trợ kí hiệu ngôn ngữ; 
trợ kí hiệu thời gian, công dụng của tài liệu,,.. 

Qua khảo sát các bảng phân loại đang sử dụng, mỗi bảng 
được xây dựng đều có quan điểm, đặc thù riêng, song các 
bảng phân loại đều trên đã thể hiện được: 
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Tính khoa học: Tính chất này thể hiện ở trật tự sắp xếp 
lôgic các lĩnh vực trị thức, phản ánh sự phát triển và mối 
liên quan, cũng như ranh giới giữa các bộ môn khoa học, 
phù hợp với phân loại khoa học hiện đại, có hệ thống chỉ 
đân, chỉ chỗ hoàn hảo thể hiện ở kết cấu các kí hiệu chặt 
chẽ và thống nhất, dễ nhớ, dễ sử dụng . 

Tính hiện đại: Tính chất này thể hiện trong nội dung 
các lớp và các lớp con của bảng phân loại, bao hàm được 
những thành tựu khoa học tiên tiến cuả thế giới và có khả 
năng tiên đoán cho tương lai . 

Tính phổ cập và mềm dẻo: đây là khả năng co giãn và 
kết hợp của bảng phân loại: nó có thể giản lược cho các thư 
viện qui mô nhỏ và có thể mở rộng cho các thư viện lớn mà 
không phá vỡ cấu trúc, có hệ thống các bảng trợ kí hiệu 
phong phú và bảng tra cứu chủ đề đây đủ. 

Tuy nhiên sử đụng loại ngôn ngữ thông tin này chúng ta 
gặp phải một số khó khăn: 

- Với việc tài liệu sắp xếp theo hệ thống các ký hiệu 
phân loại, vấn đề nghiên cứu thường phải xé lẻ và được 
phản ánh trong nhiều lĩnh vực khác nhau do đó tài liệu về 
một vấn đẻ sẽ bị phản ánh phân tán ở nhiều môn khoa học 
khác nhau trong mục lục phân loại. 

Ví dụ: Gạo 

6C§.155 - Chế biến bột 

613.26 - Thực phẩm học 
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6C9.85_ - Thương phẩm học 

6C§.II - Xay xát 

333.278 - Xuất khẩu 

hoặc Quang học 

3535 - Quang học 

331.52 - Hiện tượng quang học trong khí quyển 

506.4 - Quang học ứng dụng 

605.85 - Dụng cụ quang học 

- Do phải quán triệt nguyên tắc phân loại theo môn 
ngành trí thức thể hiện mối quan hệ thứ bậc trong trật tự 
logic và các bảng phân loại là ngôn ngữ tìm tin tiền kết hợp, 
do đó chúng không thể hiện các vấn để mới một cách kịp 
thời (phải đợi đến các kì chỉnh lí mới có thể bổ sung). Với 
kết cấu của hệ thống theo sơ đồ hình cây, mục lục phân loại 
chỉ đảm bảo cho việc thể hiện mối quan hệ nội hàm trong 
ngành tr: thức mà không phản ánh được mối quan hệ ngoại 
vi giữa các vấn đề. 

- Dù cho các bảng phân loại được biên soạn đều dựa trên 
nhiều cơ sở khoa học nhất định và có những ưu thế khác 
nhau vẻ phương pháp luận, song không thể tránh khỏi 
những hạn chế trong việc giới thiệu các vấn để mới hoặc 
các vấn đề hẹp nhưng được nhiều người quan tâm. 

Tuy nhiên không ai có thể phủ nhận được ngôn ngữ tìm 
tin theo kí hiệu phân loại cho phép định hướng và tra cứu 
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thông tin theo hệ thống các môn ngành trị thức nhanh 
chóng, thuận tiện và đầy đủ nhất. 

2.1.3 Ngôn ngữ từn tìm theo đề mục chủ đề. 

Ngôn ngữ tìm tin theo đề mục chủ đề là ngôn ngữ tìm tin 
tồn tạo song song với ngôn ngữ tìm tin theo phân loại, hiện 
nay được sử dụng khá phổ biến ở các nước phát triển. Đây 
là loại ngôn ngữ tìm tin vừa có tính tiền kết hợp vừa có tính 
hậu kết hợp. 

Với việc sử dụng ngôn ngữ tìm tin theo đề mục chủ đề, 
cho phép người dùng tin có điều kiện tiếp cận với vốn tài 
liệu / thông tin theo vấn đề. Trong ngôn ngữ tìm tin theo đề 
nục chủ đề mối quan hệ quan trọng nhất đó là mối quan hệ 
toàn thể - bộ phân. Với nguyên tắc chia nhỏ chủ để và 
nguyên tắc diện hoá, vấn để được chỉ tiết hoá ra thành 
nhiều bộ phận và nhiều diện nghiên cứu khác nhau. 

Mối quan hệ diện và mối quan hệ toàn thể bộ phận trong 
ngôn ngữ tìm tin theo chủ để được thể hiện bằng mối quan 
hệ giữa đề mục chủ đề và phụ đề (tiểu đề mục). 

Với phương pháp tổ chức hình thức lưu trữ theo chủ đẻ, 
tài liệu về cùng một vấn đề được tập trung vào một chủ đề 
với các phụ đẻ, thể hiện các góc độ nghiên cứu khác nhau 
của vấn đề, như vậy nó thể hiện ưu thế phản ánh tài liệu tập 
trung theo vấn đề, khả năng cập nhật các khái niệm mới, 
cũng như giới thiệu các vấn để mới 

Ví dụ: 
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Gạo (chủ đề) Gạo 
- Chế biến bột 6C8.155 


- Thực phẩm học 613.26 
- Thương phẩm học 6C9.85 
- Xay Xát 6C§.II 
- Xuất khẩu 333.278 


Như vậy, những vấn đề có liên quan tới Gạo sẽ được tập 
trung vào một chỗ, thể hiện một cách đầy đủ và tạo điều 
kiện cho việc nghiên cứu vấn đề được thuận lợi hơn so với 
việc tìm tin theo phân loại (Phân tán ở nhiều môn loại khác 
nhau) 

Với đặc điểm này, sử dụng ngôn ngữ tìm tín theo để mục 
chủ đề, người dùng tin có khả năng truy cập và tìm kiếm 
thông tin về một vấn đề nhanh chóng và thuận tiện. 

Với việc xây dựng ngôn ngữ tìm tin trên cơ sở của ngôn 
ngữ tự nhiên và theo trật tự vần chữ cái là đấu hiệu cơ bản 
để sắp xếp các đề mục chủ đề trong mục lục chủ đề, cũng 
như bảng tra chủ đề chữ cái trong các ấn phẩm thông tin, 
hoặc Ô tra chủ đẻ dùng cho mục lục phân loại, do đó khi có 
khái niệm mới hoặc vấn đề mới xuất hiện, chúng ta có thể 
để dàng bổ sung và cập nhật vào hệ thống và tra tìm được 
tài liệu thích hợp về các vấn đề, về khái niệm đó. 

Với các ưu thế trên, việc tra cứu thông tin rất dễ dàng, 
nhanh chóng và thuận lợi. 


Hiện nay các thư viện, cơ quan thông tin trên thế giới 
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đang sử dụng một số bảng đề mục chủ đề. Chúng ta khảo 
sát một số bảng đề mục chủ đề chính: , 


Bảng đề mục chủ đề của Thư viện Quốc hội Mỹ 

Bảng để mục chủ để của Thư viện Quốc hội Mỹ 
(Library of Congress Subject Headings: LCSH) hiện 
nay đã được xây dựng trên cơ sở bảng đề mục chủ đề mà 
thư viện đã soạn thảo từ năm 1898 dựa trên nguyên lý của 
Charler Ammi Cutter (do Uỷ ban Hội thư viện Mỹ biên 
soạn) 

Bảng đề mục chủ đề của Thư viện Quốc hội Mỹ xuất bản 
lần thứ nhất trong khoảng từ 1909 - 1914 với tên gọi “Để 
mục chủ đề sử dụng cho mục lục kiếu từ điển của Thư 
viện Quốc hội Mỹ" 

Năm 1919 - Xuất bán lần 2 

Năm 1975 - Xuất bản lần 8 và đổi tên là Library of 
Congress SubJect Headings: LCSH) 

Năm 1986 - Xuất bản lần 10. 

Năm 1993 - Xuất bản lần 16. 

Năm 2002 - Xuất bản lần 25, gồm 5 tập. 

Mỗi lần xuất bản có bổ sung thêm nhiều chủ đề mới. 

Ví dụ, năm 1993 - Xuất bản lần l6 có 199.000 đề mục 
củ đẻ, trong đó có 7.000 chủ để mới và chỉ dẫn, tham 
chiếu; có 2.800 chủ đề,có sự thay đổi ít nhiều. 


bÌ) 





Trong Bảng để mục chủ đề của Thư viện Quốc hội 
Mỹ các đề mục chủ để được xây dựng trên cơ sở : tên nhân 
vật, tên các tổ chức, cơ quan, đoàn thể, tên các đối tượng 
địa lý, địa danh, tên các sự vật hiện tượng, các vấn đề, đề tài 
nghiên cứu....Về mặt từ loại , để mục chủ đề có thể là một 
từ hoặc một cụm từ, chúng có thể là danh từ hoặc một tập 
hợp từ. Trong LCSH ta có thể tìm các đạng đề mục chủ đề: 

- Là danh từ (dạng số nhiều) 

Dogs (chó) 

Children (trẻ em) 

Houses (ngựa). 

Schools (trường học). 

Animals (động vật) 

- Là một cụm danh từ (danh từ và tính từ) 

Vietnamese Literature (văn học Việt Nam} 

Rusian Newspapers (báo Nga). 

- Là một cụm từ gôm một danh từ kết hợp với một danh 
từ khác được sử đựng như một tính từ. 

Oil Industry (Công nghiệp dầu mỏ) 

- Là một cụm từ bao gồm một danh từ kết hợp với một 
danh từ khác bởi giới từ: 

Church im art (nhà thờ trong nghệ thuật) 

Human experimentation in medicine (thực nghiệm trên 
cơ thể người trong y học). 
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- Là một cụm từ gồm 2 danh từ liên kết với nhau bởi liên 
từ. 

Familia and society (Gia đình và xã hội) 

Culture and Education (Văn hoá và giáo dục ) 

Để giúp cho người định chủ đề và tra tìm tin theo chủ đề 
được chính xác nội dung của tài liệu theo các khía cạnh, 
góc độ nghiên cứu khác nhau của chủ đề, trong bảng đề 
mục chủ đề của thư viện quốc hội Mỹ còn lập ra các phụ để 
(Subdivistions): 

+ Phụ đề đề tài (Topic subdivision) 

+ Phụ đề hình thức (Form subdivision) 

+ Phụ đề thời gian (Chronological subdivision) 

+ Phụ đề địa lý (Geographic subdivision) 

Ngoài ra LCSH còn tồn tại hệ thống chỉ chô, chỉ dẫn rất 
phong phú: 

+ Dùng (use) 

+ Dùng cho (se for = UF) 

+ Nghĩa rộng hơn (Broader terms = BT) 

+ Nghĩa hẹp hơn (Narrower terms NT) 

+ Thuật ngữ liên quan (Related terms RT) 

+ Cùng xem (%e also = SA). 

LCSH được sử dụng rộng rãi ở nhiều nước đăc biệt là các 
nước nói tiếng Anh. 
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Ngoài LCSH hiện nay ở Mĩ còn tồn tại 2 bảng đề mục 
chủ đề khác cũng được sử dụng rộng rãi, đó là: 

Bảng để mục chủ để Sears (Sears list of subject 
headings) 

Bảng này được dùng cho các thư viện công cộng cỡ vừa 
và nhỏ. 

Năm 1923 - Xuất bản lần thứ 1 

Năm 2002 - Xuất bản lần thứ 17 

Bảng đề mục chủ đề dùng cho tài liệu thiếu nhỉ 
(subject headings oƒ chữdren°s literafure ) 

Năm 1969 - Xuất bản lần thứ l 

Bảng này cũng liên tục được tái bản và bổ sung. 


Bảng RAMEAU 

Reperoire đAutorte© Matiere Encyclopedique et 
Alphabetique Unifie (tên viết tắt RAMEAU) - Danh mục 
các đề mục chủ đề được sử dụng có tính chất bách khoa và 
. được sắp xếp theo vần chữ cát 

RAMEAU được xây dựng trên cơ sở Bảng đề mục chủ 
đề của Thư viện Quốc hội Mỹ. Ban đầu Thư viện Quốc giá 
Canađa vùng Kebếch chuyển dịch LCSH sang tiếng Pháp 
để xử lý tài liệu, sau đó Thư viện Quốc gia Pháp đã sử dụng 
bảng này có bổ sung và biên soạn lại. 

Bảng RAMEAU chủ yếu được xuất bản dưới dạng 
Microphich. 
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Bảng RAMEAU được sử dụng làm ngôn ngữ tìm tin ở 
một số nước nói tiếng Pháp như: Thư viện Quốc gia Pháp, 
Thư viện Quốc gia Canađa, Thư viện Quốc gia Thuy Sỹ. 
Giống như LCSH bảng RAMEAU cũng được xây dựng trên 
cơ sở: tên nhân vật, tên các cơ quan, tổ chức,...Các loại phụ 
để như: Phụ đẻ nội dung, phụ đề hình thức, phụ đề thời 
gian, phụ đề địa lý và các loại chỉ dẫn: Xem, dùng cho, 
thuật ngữ hẹp hơn, thuật ngữ rộng hơn,... 


Bảng đề mục chủ đề ở Việt Nam 

Khác với các thư viện nhiều nước trên thế giới, ở Việt 
Nam các thư viện không sử dụng bảng phân loại để mô tả 
nội dung tài liệu và tra cứu thông tin trước, mà lại sử dụng 
đề mục chủ đề. Định chủ để và tra cứu thông tin theo chủ 
đẻ được quan tâm từ thời Pháp thuộc ở các thư viện lớn như: 
Thư viện Trung ương Đông dương, Thư viện Trường Viễn 
đông Bác cố, Thư viện Trường Đại học Y Dược,...Tại các 
thư viện này đã xây dựng 2 loại mục lục: Mục lục Chủ đề 
và Mục lục Tác giả. Mục lục Chủ đề chỉ được xây dựng cho 
sách tiếng Pháp. 

Sau ngày hoà bình lập lại ở miền Bắc (10 / 1954), các 
thư viện vẫn tiếp tục tổ chức mục lục chủ đề với tư cách là 
ngôn ngữ tìm tin chính, tuy nhiên có sự thay đổi cơ bản đó 
là nó được phản ánh bằng tiếng Việt - quốc ngữ : ngôn ngữ 
chính thức của nước Việt Nam độc lập. Tuy nhiên ngôn ngữ 
tìm tin này tồn tại không lâu, sau 1960 là ngừng, thay 
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thế cho nó là ngôn ngữ tìm tin theo phân loại. Thời gian gần 
đây Thư viện Quốc gia Việt Nam cũng đã có chủ trương 
khôi phục lại việc định chủ đề và xây dựng mục lục chủ để 
giúp cho việc tra tìm tin theo nội dung một cách đa dạng 
hơn và thuận lợi hơn. Như vậy để làm được điều này đòi hỏi 
phải đầu tư kinh phí, cũng như sức lực rất lớn để xây dựng 
bảng đề mục chủ đề phù hợp. 

Cho đến nay ở Việt Nam một số thư viện đã xây dựng 
riêng cho mình bảng Để mục chủ đề để phục vụ cho việc 
xây dựng bộ máy tra cứu và tra tìm tin như thư viện trường 
Đại học Y Hà nội. 

Bảng Đề mục chủ đẻ của thư viện trường Đại học Y 
khoa Hà Nội 

Bang đề mục này gồm 2 phần: 

Phần ï: Chủ đề chính 

Phần 2: Gồm các trợ ký hiệu ghép với chủ đẻ chính 
nhằm chi tiết hoá các khía cạnh, góc độ nghiên cứu của chủ 
đề chính. 

Trong phần 1: Các chủ để được xắp xếp theo thứ tự vần 
chữ cái có kèm theo tên của các chủ đề và ký hiệu của chủ 
đề đó. 

Ví dụ: 

Bệnh học (và sinh lý bệnh): BI 

Chãn thương học: C1 


mc†. tk. 


Tiêu hoá: TR 
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Tra cứu từ điển: T13 

Các chủ đề trên có thể được chỉ tiết bằng các mục nhỏ 

00 - Những vấn đề chung 

10 - Mô tả các biểu hiện chung tại các cơ quan bộ phận 
và nguồn gốc phát sinh... 

Từng mục nhỏ chỉ tiết hoá tiếp: 

00 - Những vấn đề chung 

ỐI - Giáo trình 

Thực chất, Bảng để mục của Thư viện Đại học Y Hà 

Nội là bảng để mục chủ đê vẫn còn rất sơ sài, nhiều đề mục 
vẫn chưa được phản ánh, hoặc phản ánh chưa chỉ tiết, do đó 
khi tra tìm chưa thật thuận tiện, nhanh chóng và đầy đủ. 
Tuy nhiên đó cũng là một sự cố gắng lớn của thư viện phần 
nào đáp ứng với nhu cầu tra tìm tài liệu / thông tin mang 
tính đặc thù về y học của người dùng tin. 

2.1.4. Ngôn ngữ tìm tin theo từ khoá, từ chuẩn 

Cùng với sự phát triển mạnh mẽ của công nghệ thông 
tin, hiện nay các thư viện và cơ quan thông tin trên thế giới 
cũng đã ứng dụng rộng rãi tin học vào hoạt động của mình. 
Nhiều ngân hàng dữ liệu, mạng thông tin, hàng vạn cơ sở 
dữ liệu được xây dựng với nhiều phần mềm tư liệu đã được 
ra đời giúp cho việc lưu trữ và tra cứu thông tin được nhanh 
chóng và đầy đủ. Ngôn ngữ tìm tin theo từ khoá, từ chuẩn 
được sử dụng rất rộng rãi từ những năm 1970 trở lại đây. 
Đặc biệt ở Việt Nam, sau những năm 1990 hầu hết các thư 
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viên, cơ quan thông tin đều đã ứng dụng công nghệ thông 
tin vào các khâu hoạt động của mình như: xây dựng CƠ SỞ 
dữ liệu, in phiếu mục lục, biên soạn thư mục, quản lý bạn 
đọc, tra cứu thông tin tự động hoá,.. Song song với các loại 
ngôn ngữ tìm tin khác theo nội dung như: chỉ số phân loại 
và chủ đẻ, từ khoá, từ chuẩn được sử dụng như một loại 
ngôn ngữ tìm tin chính trong các thư viện, cơ quan thông 
tin, giúp cho việc tìm tin nhanh chóng, thuận lợi và đầy đủ. 

Ngôn ngữ tìm tin bằng từ khoá, từ chuẩn giúp tra cứu 
thông tin có nội dung sâu sắc hơn, cụ thể hơn, chính xác 
hơn, đầy đủ hơn, với số lượng vô cùng. Để định từ khoá tài 
liệu và tra cứu thông tin một cách chính xác cần phải xây 
dựng bộ từ khoá chuẩn/ Từ điển từ chuẩn. 

Hiện nay, nhiều cơ quan thông tin - thư viện ở Việt Nam 
đã xây dựng được các cơ sở dữ liệu phản ánh nguồn tài liệu 
có tại cơ quan mình hoặc nối mạng thông tin trong nước, 
song việc xây dựng bộ từ khóa, từ chuẩn, tiến tới xây dựng 
từ điển từ chuẩn vẫn chưa có sự hợp tác thống nhất và tiến 
hành một cách khẩn trương trong phạm vi quốc gia, do 
ngôn ngữ tiếng Việt rất đa dạng, phong phú về ngữ nghĩa, 
vì vậy nếu mỗi thư viện định từ khoá theo cách của mình, sẽ 
dẫn tới mất tin trong quá trình tra cứu thông tin và ảnh 
hưởng trực tiếp tới khai thác các mạng thông tin quốc gia. 

Tuy nhiên bước đầu chúng ta cũng đã có một số các 
bảng từ khoá, từ điển từ chuẩn trong và ngoài nước để tham 
khảo và sử dụng : 
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Từ điển từ chuẩn của UNESCO 

Từ điển từ chuẩn của UNESCO (Thesaurus UNESSCO 
gọi tắt UT) được biên soạn từ năm 1973 - 1974, gắn liền với 
việc áp dụng máy tính điện tử vào công tác thông tin - tư 
liệu. Từ điển từ chuẩn của ƯNESCO gồm có 8.500 từ chuẩn 
phân ánh các lĩnh vực khoa học khác nhau như: 

- Tổng loại 

- Khoa học kỹ thuật 

- Khoa học xã hôi 

- Con người và văn hoá 

- Giáo dục 

- Truyền thông 

- Thông tin - thư viện - lưu trữ 

Trong Từ điển từ chuẩn với mỗi thuật ngữ có thể bao 
gồm các chú giải về mặt: 

- Thuật ngữ rộng hơn (Broader terms) 

- Thuật ngữ hẹp hơn (Narrower terms) 

- Thuật ngữ liên quan (Related terms) 

- Dùng (se) 

- Dùng cho (Dsed for) 

- Thuật ngữ cao nhất (Top terms) 

Với một số từ chuẩn, có thể có thêm phần chú giải thuật 

ngữ (scope note) kèm theo. 
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Trong UT liệt kê bảng danh mục theo vần chữ cái các từ 
chuẩn có liên quan đến 5 lĩnh vực chính mà UNESCO quan 
tâm như: giáo dục, khoa học kỹ thuật, khoa học xã hội, văn 
hoá và truyền thông. 

UT cho đến nay vẫn là bảng từ điển từ chuẩn mang 
tính quốc tế duy nhất tồn tại và phổ biến rộng rãi. 


Từ điển từ khoá khoa học và công nghệ 

Ở Việt Nam Trung tâm Thông tin Khoa học và Công 
nghệ Quốc gia đã dựa theo nguyên tắc của UT để biên soạn 
Từ điển từ khoá khoa học và công nghệ. 

Từ cuối những năm 1980 (1986) Trung tâm Thông tin 
Khoa học và Công nghệ Quốc gia đã tiến hành tin học hoá 
hoạt động thông tin tư liệu. Trung tâm đã xây dựng các cơ 
sở dữ liệu: cơ sở dữ liêu BOOK; SCTTEC, kết quả nghiên 
cứu, STAND, DETAI, DINFO.,.. và đã tiến hành sử dụng từ 
khoá để xử lí nội dung tài liệu và làm ngôn ngữ tìm tin phục 
vụ cho việc tra cứu thông tin tự động hoá. 

Thời gian đầu, Trung tâm sử dụng ngôn ngữ từ khoá tự 
do để xử lí tài liệu, tố chức lưu trữ và tìm kiếm thông tin. Từ 
khoá của tài liệu được định tự do từ bản văn hoặc do cán bộ 
định từ khoá tự đặt ra, ít được tiến hành thẩm tra qua ngôn 
ngữ có kiểm soát như: các từ điển ngôn ngữ, từ điển thuật 
ngữ, tiêu chuẩn của Việt Nam về thuật ngữ khoa học, dẫn 
tới hiệu quả tra cứu tin không cao, do mức độ hình thức hoá 
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thuật ngữ thấp, tính hệ thống hoá không đảm bảo, thông tin 
bị tản mạn và mang nặng tính chủ quan của người xử lý tài 
liệu và tra cứu. 

Nhàm khác phục nhược điểm trên, để tăng hiệu quả sử 
dụng và thống nhất của ngôn ngữ tìm tin bằng từ khoá trong 
các thư viện và cơ quan thông tin, năm 1997 Trung tâm 
Thông tin Khoa học và Công nghệ quốc gia đã hoàn thành 
bộ từ khoá đa ngành khoa học tự nhiên và công nghệ, năm 
2001 đã xuất bản Từ điển từ khoá khoa học và công nghệ 
(mà tiền thân là một công trình nghiên cứu cấp bộ của 
Trung tâm được tiến hành từ năm 1993-1997). 

Từ điển gồm 2 tập (50.000 đơn vị từ vựng) 

T.I. Bảng từ khoá theo vần chữ cái. 

T.IL. Bằng từ khoá hoán vị. 

Táp ï:Bằng từ khoá theo vần chữ cái: 

Trong bảng này, các từ khoá được sắp xếp thành 2 nhóm: 

- Nhóm từ khoá chính: gôm các từ mô tả chủ đề chính 
của tài liệu đa ngành khoa học.Theo vần chữ cái tiếng Việt 
từ A đến Z, theo trình tự phát âm và tổ thống đấu trong 
tiếng Việt. 

Những quan hệ tương đương quy ước giữa các từ khoá 
cũng được trình bày trong phần này, trong đó các từ không 
ưu tiên được chỉ dẫn đến từ ưu tiên bằng ký hiệu chỉ dẫn sử 
dụng. Còn các từ ưu tiên được trình bày quan hệ với các từ 
không ưu tiên bằng một ký hiệu chỉ dẫn dùng cho. 
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Ví dụ: 

Anten chảo 

DC Anten parabon 

Anten parabon 

SD Anten chảo 

Bệnh xuân lá 

DC Bénh cuốn lá 

DC Bệnh quăn lá 

DC Bệnh xuắn lá 

Bệnh xuắn lá 

SD Bệnh xuan lá 

- Nhóm từ khoá bổ trợ: 

Gồm những từ có cách viết đặc biệt, được nhóm lại 
thành từng bảng để tiện tra cứu. Các từ trong bảng cũng 
được sắp xếp theo thứ tự vần chữ cái và trình tự dấu phát âm 
như ở phần nhóm từ khoá chính. Các nhóm từ khoá trong 
bộ từ khoá gồm: 

+ Bảng tra địa đanh: là danh mục các từ khoá chỉ tên 
các châu lục, các-nước, các quần đảo, sông, núi lớn và các 
khu vực địa lý. Cách phiên âm khác nhau được chỉ dẫn đến 
cách phiên âm thống nhất theo ký hiệu sử dụng. 

Ví dụ: 

°® Hắc Hải 

SD Biển đen 
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Hàn Quốc 
DC Nam Triều Tiên 
Nam Triều Tiên 
SD Hàn Quốc 
+ Bảng tra tên các hiệp hội, cơ quan tổ chức nghiên cứu 
và phát triển công nghệ kinh tế, môi trường ở cấp quốc tế, 
khu vực và quốc gia lớn gồm: bảng tra tên viết tắt, viết tên 
đầy đủ. 
Ví dụ: 
BIEF: Ngân hàng Thông tin Quốc tế về các nước nói 
tiếng Pháp 
BN: Thư viện Quốc gia (Pháp). 
UNESCO: Tổ chức văn hoá - Khoa học giáo dục của 
Liên hợp quốc 
+ Bảng tra tên đầy đủ - Tên viết tắt 
Ví dụ: 
AAEE: Hội kỹ sư điện từ Mỹ 
EUROCEAN: Hội hải dương học châu Âu 
+ Bảng tên thuốc: gồm tên gốc các thuốc chữa bệnh đã 
được chính thức đăng ký với tổ chức y tế thế giới: 
Ví dụ: +Ampiciin 
+Atropin 


+ Bảng tên sinh vật: gồm tên các sinh vật có giá trị hoặc 
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có hại cần phòng trừ, có mặt tại Việt Nam hoặc có liên quan 
đến Việt Nam 
Bảng tra tên sinh vật Việt - Latinh 

Vídụ: Anas poecilorhynchos: Vịt trời. 

Anemonia: Hải quỳ hoa cúc. 

Táp 2: Bảng tra hoán vị. 

Bảng tra hoán vị của Từ điển từ khoá khoa học và công 
nghệ giúp người dùng tin dễ dàng tra cứu được tất cả các từ 
khoá - là từ cùng chứa một từ được quan tâm, đồng thời 
cũng có tác dụng làm nổi bật tất cả các từ có ý nghĩa trong 
từng từ khoá. : 

Ví dụ: 

Khi có yêu cầu tin về "Chẩn đoán"ta có.thể tìm được từ 
khoá có liên quan tới " Chẩn đoán” như: 

Bộ do Chẩn đoán 
Dụng cụ Chẩn đoán 
Máy Chẩn đoán 
Thiết bị Chẩn đoán 
Chân đoán học 
Chẩn đoán huyết thanh 
Chẩn đoá kỹ thuật 
Chẩn đoán sớm 
Chẩn đoán từ xa,.. 








Việc hoán vị các từ khoá với một số từ phức tạp để bị 
nhầm lẫn như tên sinh vật và tên loại, họ, bộ,.. sinh vật sẽ 
giúp cho cán bệ xử lý thông tin và người dùng tin có thể 
xác định được cách dùng từ chính xác nhất. 

Bảng tra hoán vị được trình bày theo các phần tử được 
hoán vị, các phân tử đó được xắp xếp theo vần chữ cái. 

Trong bảng tra hoán vị các từ khoa học được hoán vỊ là: 

- Các từ khoá Khoa học - Công nghệ 

- Tên sinh vật bằng tiếng Việt 

Các loại từ khoá không được hoán vị: 

- Từ khoá địa lý 

- Tên các hiệp hội tổ chức 

- Tên thuốc 


- Tên các sinh vật bằng tiếng Latinh. 


Bộ từ khoá của Thư viện Quốc gia Việt Nam 

Bộ từ khoá của Thư viện Quốc gia Việt Nam được biên 
soạn và xuất bản năm 1997 có khoảng 10.000 đơn vị từ 
vựng. 

Diện bao quát đề tài của bộ từ khoá mang tính chất đa 
ngành: liên quan đến tất cả mọi lĩnh vực chính trị, kinh tế, 
văn hoá, khoa học kỹ thuật, văn học nghệ thuật, y 
học....gồm các sự vật, hiện tượng, tên các nhân vật, đoàn 
thể, tố chức, các địa danh, các vùng địa lý.... 
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Bộ từ khóa của Thư viện Quốc gia Việt Nam được trình 
bày trong mội tập và được chia ra các bảng: 

~ Bảng tra từ khóa nội dụng: gồm những từ chỉ tiết, khái 
niệm thuộc các ngành, các lĩnh vực khác nhau. Từ khoá 
được trình bày theo trật tự chữ cái và theo trình tự đấu phát 
âm. Các từ khoá được chía làm hai loại: 

+ Từ tt tiên: là những từ được sử dựng khi định từ khoá 
hoặc khi tra cứu thông tin. 

+ Từ không rat tiên: là những từ nhằm hướng dẫn người 
định từ khoá hay người tra cứu hiểu rõ mối quan hệ giữa 
chúng với từ không ưu tiên. 

Ví dụ: 

- Danh lam. 

Xem: Danh lam thắng cảnh 

- Danh lam thắng cảnh 

CX: Di tích lịch sử 
- Di tích văn hoá 
DC: Danh lam 

- Danh lam thắng cảnh 

+ Bảng tra từ khoá nhân vật: 

Gồm các nhân vật ở Việt Nam và ở nước ngoài, được xắp 
xếp theo vần trật tự chữ cái của tên đối với các nhân vật 
nước ngoài và họ đối với nhân vật Việt Nam, có kèm theo 
phần năm sinh năm mất. Tên một số nhân vật được thể hiện 
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dưới nhiều bút danh hoặc viết khác nhau do phiên âm được 
quy vào một tên thường dùng có kèm theo chỉ dẫn “xem” và 
“DC” (dùng cho) 
Ví dụ: 
- Bush, G. (1924 -) 
Xem: Busơ, G 
- Busơ,G.(1924 -) 
DC: Buah,G. 
- Becthoven, L. (1770 -I827) 
xem: Bêthôven, L. 
- Bêthôven, L. (1770 -1827) 
DC: Be- thô - ven, L. 
- Becthoven, L. 
- Bethoven, L. 
+ Bảng tra từ khoá Địa lý Việt Nam: gồm 2 phần 
Phần 1: Từ khoá sắp xếp theo vần chữ cái các huyện. 
tỉnh (trong tỉnh có tên các huyện). 
Vị dụ: 
Hà Nam 
Bình Lục 
Duy Tiên 
Kim Bảng 
Lý Nhân 
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Phủ Lý 

Thanh Liêm, 

Phản 2: từ khoá sắp xếp theo huyện, mỗi huyện có chú 
thích thuộc tỉnh nào. 

Ví dụ: 

Đông anh (Hà Nội) 

Đông Hà (Quảng Trị) 

Đông Hưng (Thái Bình) 

Đông Sơn (Thanh Hoá} 

Đông Triều (Quảng Ninh) 

+ Bảng tra từ khoá địa lý thế giới: gồm các từ khoá sắp 
xếp theo Châu lục: Châu Á, Châu Áu. Châu Đại Dương - 
châu Úc, châu Mỹ, Châu Phi. Tên địa danh nước ngoài 
được ưu tiên thông dụng. 

Ví dụ: 

- Australia 

Xem: ôtxtraylia 

- Arhentina 

Xem: Achentina 


Bộ từ khoá về kinh tế - xã hội 

Bộ từ khoá về kinh tế xã hội của Trung tâm Thông tin 
(Bộ kế hoạch - Đầu tư) được xây dựng và hoàn thành năm 
1296, có khoảng 5000 đơn YỊ từ vựng. 


ó8 





Bộ từ khoá gồm 2 tập : bao quát đề tài thuộc 2 lĩnh vực: 

- Lĩnh vực kinh tế: chính sách kinh tế 

+ Điều kiện kinh tế 

+ Các ngành kinh tế: Công nghiệp, Nông nghiệp, 
Thương mại, Giao thông, Tài chính,... 

- Lĩnh vực văn hoá xã hội: Văn hoá, Giáo dục, Đào tạo, 
Lao động, Dân số, Môi trường.... 

Tập 1: Từ khoá sắp xếp theo vẫn chữ cái và các dấu 
phát âm (= giông như bộ bách khoa đa ngành khoa học tự 
nhiên - công nghệ). Đi kèm theo từ khoá bằng tiếng Việt là 
từ khoá bằng tiếng Anh và các chỉ số phân loại dùng để xác 
định từ khoá thuộc nhóm nào trong tập 2. 

Để thể hiện mối liên hệ với nhau giữa các từ khoá, có thể 
hiện các mối quan hệ tương đương, liên đới và thứ bậc với 
các chỉ đân (giống như Từ điển từ chuẩn của UNESCO): 

BT: Ngha rộng hơn 

NT: Nghĩa hẹp hơn 

RT: Nglữa liên quan 

UFE: Sử dụng cho 

SN: Ghi chú phạm vị 

Tập 2: bang phản loại tài liệu theo chủ đề và các nhóm 
từ mô tả: sản 

Trong tập này các từ khoá được sắp xếp theo từng đề 
mục phân loại. Trong mỗi đề mục, các từ được sắp xếp theo 


vần chữ cái và vần phát âm. 
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Bảng phân loại gồm 19 đẻ mục - được đánh số thứ tự từ 
ÖI - 19: 

Ví dụ: 

01: Hợp tác quốc tế, quan hệ quốc tế 

International cooperation. International relatlons. 

02: Chính sách kinh tế, chính sách xã hội, kế hoạch hoá. 

Economic policy, social policy, pÏaning. 


19: Thông tin - Tự liệu. 

Information, documentation. 

Trong mỗi để mục lại được chia nhỏ thành các tiếu mục. 

Ví dụ: 

07 . Nông nghiệp 

07.01. Kinh tế học Nông nghiệp 

7,03.01. Các đồn điền 

Như vậy, hiện tại ở Việt Nam đang tồn tại 4 Bộ từ khoá, 
tuy nhiên các bộ từ khoá này có số lượng từ khoá không 
nhiều (Từ điển từ khoá khoa học- công nghệ 50.000 từ, Bộ 
từ khoá của Thư viện Quốc gia Việt Nam 10.000 từ và Bộ từ 
khoá về kinh tế xã hội 5.000 từ), không đủ để phản ánh các 
khái niệm trong các ngành khoa học, các lĩnh vực hoạt động 
trong giai doạn hiện nay, chưa nói đến sự phát triển nhanh 
chóng của khoa học - kỹ thuât và sự ra đời nhiều ngành 
khoa học mới. 
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Trong quá trình tra cứu, cán bộ thông tin phải căn cụ vao 
cơ sở dữ liệu cụ thể để xác định Thư viện - cơ quan thông 
tin đó định từ khoá theo bộ từ khoá nào, trên cơ sở đó thể 
hiện yêu cầu tin cho sát. Tuy nhiên, dù cơ quan thông tin - 
thư viện có sử dụng bộ từ khoá nào đi chăng nữa, cán bộ tra 
cứu cũng phải linh hoạt để đáp ứng nhu cầu tin của người 
dùng tin. 

Để tra cứu tin tự động hoá cần xây dựng phương trình 
tìm. Phương trình tìm cẩn: hai yếu tố: Từ khoá và toán tử 
tìm. 

Về phương diện cú pháp được thể hiện qua những quan 
hệ logic OR, AND, NOT (sẽ được trình bày kỹ ở Chương 
4: Tìm tự động hóa). 

a¡ 2.2. Bộ máy tra cứu. 

Bộ máy tra cứu là tập hợp các công cụ và phương tiện 
cho phép tìm, cung cấp các tài liệu / thông tin, đữ kiện phù 
hợp với diện đề tài bao quát của cơ quan thông tin - thư 
viện, đáp ứng yêu cầu tin của người dùng tin. 

Trên cơ sở các hình thức lưu trữ thông tin, bộ máy tra 
cứu được phân chia thành: 

- Bộ máy tra cứu thông tin truyền thống/ thủ công, 

- Bộ máy tra cứu thông tin bán tự động hoá, 

- Bộ máy tra cứu thông tin tự động hoá. 

2.2.1 Bộ máy tra cứu thông tin truyền thống! Thủ công 

Bộ máy tra cứu truyền thống/ thủ công gồm: các bộ 
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phiếu tra cứu thư mục, bộ phiếu tra cứu dữ kiện, hệ thống 
mục lục và kho tài liệu tra cứu. 

2.2.1.1. Các bộ phiếu tra cứu thự mục 

Là công cụ phản ánh các tài liệu / thông tin về những 
vấn đề và để tài mà cơ quan thông tin - thư viện phải phục 
vụ không phụ thuộc vào loại hình tài liệu và nơi bảo quản 
chúng. 

+ Bộ phiếu tra cứu chính 

Bộ phiếu tra cứu chính là một bộ phận chủ yếu, quan 
trọng nhất của bộ máy tra cứu, Bộ phiếu tra cứu chính có 
nhiệm vụ trả lời tất cả những yêu cầu tin chuyên để theo 
diện bao quát đề tài, của cơ quan thông tin. 

Đặc điểm của bộ phiếu tra cứu chính là nó bao quát toàn 
bộ những chuyên đề chính cũng như những chuyên đẻ có 
liên quan, kế cận, phản ánh các tài liệu không phụ thuộc 
vào các loại hình và nơi bảo quản những tài liệu ấy. Loại bộ 
phiếu này thường được xây dựng tại các thư viện thuộc các 
viện nghiên cứu chuyên nghành: Viện nghiên cứu chè ,Viện 
nghiên cứu cây lương thực - thực phẩm,.. hoặc tại các trung 
tâm thông tin như: Trung tâm thông tin Địa chất, Trung tâm 
thông tin thương mại,... 

+ Các bộ phiếu tra cứu chuyên đẻ 

Các bộ phiếu tra cứu chuyên đề được xây dựng để trả lời 
những yêu cầu tin theo những vấn đề, đề tài hẹp cụ thể nào 
đó được nhiều người quan tâm và có tính cấp bách. 
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Đặc điểm của các bộ phiếu chuyên đề là chúng phản ánh 
vấn đẻ một cách toàn diện nhất, đầy đủ nhất và mang tính 
thời sự rõ ràng. 

Ví dụ : 

Trong tình hình hiện nay, nạn ma tuý có nguy cơ phát 
triển ở các trường học, để phát triển và ngăn chặn tệ nạn 
này các trường học đã quan tâm theo dõi và có biện pháp xử 
lý kịp thời. Thư viện nhiều trường đã xây dựng các hộp 
phiếu chuyên đẻ như “Tệ nạn ma tuý và cách phòng chống” 
hoặc “Phòng và chống HIV/AIDS " 

Đặc biệt các thư viện thuộc hệ thống thư viện công cộng 
thường xuyên tổ chức các hộp phiếu chuyên đề nhân dịp 
các ngày lễ lớn của đất nước như: Ngày sinh nhật của Chủ 
tịch Hồ Chí Minh, Ngày quốc khánh 2-9, các kì đại hội 
Đảng, ngày giải phóng Thủ Đó, Ngày chiến thắng lịch sử 
Điện Biên Phủ, 

Các thư viện đã thu thập thông tin từ các báo Trung 
ương, địa phương và tạp chí định kỳ nơi cung cấp thông tin 
một cách đây đủ, kịp thời và sát thực. 

+ Các hộp phiếu thư mục 

Các hộp phiếu được tổ chức ở các thư viện rất đa dạng, 
trong đó phải kể đến bộ phiếu tra cứu theo loại hình tài liệu. 

Các hộp phiếu tra cứu theo loại hình tài liệu giúp bạn 
đọc theo dõi thông tin về các loại hình tài liệu đã được nhập 
về thư viện một cách có hệ thống. 
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Nhiều thư viện và cơ quan thông tin đã xây dựng các hộp 
phiếu thư mục các bài trích báo, tạp chí. 

Ví dụ : 

Trung tâm thông tỉn - Thư viện trường Đại học Văn hoá 
Hà nội đã xây dựng nhiều hộp phiếu thư mục bài trích (Báo 
tạp chí, sách) như: 

- Hộp phiếu thư mục bài trích về Văn hoá nghệ thuật, 

- Hộp phiếu thư mục bài trích về Thông tin - thư viện, 

- Hộp phiếu thư mục bài trích về Bảo tồn bảo tàng, 

- Hộp phiếu thư mục bài trích về Du lịch,... 

Thư viện trường Đại học Bách khoa Hà Nội đã xây dựng 
các hộp phiếu như: 

- Hộp phiếu Tạp chí ngoại văn, 

- Hộp phiếu Tạp chí tiếng Việt, 

- Hộp phiếu Luận án khoa học.... 

Ở hầu hết các thư viện và trung tâm thông tin thuộc các 
viện nghiên cứu như Viện khoa học kỹ thuật xây dựng, 
Viện vật liệu xây dựng, Viện khoa học kỹ thuật nông 
nghiệp,:..đều xây dựng: 

- Hộp phiếu các báo cáo khoa học và những công trình 
nghiên cứu: phản ánh những đề tài nghiên cứu đã được tiến 
hành, giúp các nhà nghiên cứu tham khảo và nghiên cứu 
không bị trùng lặp. 

- Hộp phiếu catalo công nghiệp: giới thiệu các mẫu, mã 
sản phẩm của cơ quan, xí nghiệp và của nước ngoài, 
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- Hộp phiếu các công trình thiết kế thử nghiệm... 

+ Hộp phiếu tra cứu nhân vật Danh nhân 

Hộp phiếu này phản ánh vẻ thân thế và sự nghiệp các 
nhân vật nổi tiếng trong các lĩnh vực khoa học - kỹ thuật, 
văn học - nghệ thuật, kinh tế, văn hoá... trong nước và trên 
thế giới, giúp cho người đùng tin có điều kiện tìm hiểu một 
cách toàn điện, đầy đủ và nhanh chóng về các nhân vật đó. 

Ví dụ: 

Thư viện triều Nguyễn (thuộc Trung tâm bảo tồn Cố Đô 
Huế -Tp. Huế)) xây dựng: Hộp phiếu các vua, chúa triều 
Nguyễn, 

Thư viện tỉnh Nghệ An xây dựng: Hộp phiếu Danh 
nhân Nghệ tĩnh, 

+ Các hộp phiếu tra cứu về địa chí 

Hộp phiếu tra cứu về địa chí được xây dựng nhằm phản 
ánh về tài nguyên thiên nhiên, danh lam thắng cảnh, tiểm 
nâng kinh tế, cọn người,..của từng địa phương khác nhau. 

Ví dụ: Thư viện Viện thông tin - bảo tàng địa chất 
khoáng sản đã tổ chức hộp phiếu địa chí về các khoáng sản 
có tại các địa phương, giúp cho cán bộ nghiên cứu tra cứu 
được nhanh chóng những thông tin cần thiết. Tuy nhiên hầu 
hết các thư viện tỉnh đều đã tổ chức mục lục địa chí phản 
ánh thông tin một cách đầy đủ, toàn diện vẻ địa phương 
mình. 
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2.2.1.2 Các bộ phiếu dữ kiện 

Các bộ phiếu dữ kiện là những hệ thống tìm tin cho phép 
giải đáp các yêu cầu tin dữ kiện cụ thể, giúp người dùng tin 
không phải tra cứu tài liệu và quá trình rút ra từ những tài 
liệu có chứa dữ kiện cần thiết. 

Đặc điểm của các bộ phiếu dữ kiện. 

Đối tượng mô tả trong bộ phiếu dữ kiện không phải là 
một tài liệu trọn vẹn nào đó, mà là từng dữ kiện hoặc tập 
hợp những dữ kiện cần thiết được rúi ra từ một / nhiều tài 
liệu: những dữ kiện này liên quan với nhau trong một phạm 
vi một mẫu tìm /đối tượng hay quá trình. 

Mỗi phiếu phản ánh một đối tượng 

Thông tin trong phiếu dữ kiện phải được phân tích, so 
sánh và đánh giá nhằm bảo đảm độ tin cậy cho phép và tính 
chính xác cao. : 

Phiếu dữ kiện cần bảo đảm tính cập nhật và khi cần thiết 
có thể sửa đổi những dữ kiện. 

Một số bộ phiếu đữ kiện thường được xây đựng trong CƠ 
quan thông tin - thư viện. 

- Bộ phiếu các sản phẩm, thiết bị mới. 

Loại bộ phiếu này dùng để trả lời các yêu cầu về tính 
năng tác dụng, các đặc tính kỹ thuật, các đặc điểm thiết kế, 
giá cả, cơ quan xí nghiệp sản xuất 

Ví dụ: 

Sản phẩm: Giây da, đồ hộp, may mặc, đông lạnh... 
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Thiết bị: Thiết bị điện, thiết bị mạng máy tính... 

- Bộ phiếu vật liệu 

Bộ phiếu vật liệu cung cấp dữ kiện về tính năng, tác 
dụng, lĩnh vực ứng dụng, thành phần hoá học, tính chất hoá 
học, cơ học, công nghệ chế tạo, giá thành, tính ưu việt so 
với Các vật liệu tương tự, cơ quan thiết kế, cơ sở sản xuất. 

Ví dụ : 

Vật liệu xây dựng: sắt, thép, compozïit,.. 

Vật liệu đệt: Bông, sợi, vải,.. 

- Bộ phiếu các quy trình công nghệ và các sáng kiến cải 
tiến 

Bộ phiếu này cung cấp những tin tức về những quy trình 
công nghệ (tiên tiến, các trang thiết bị cơ giới hoá, tự động 
hoá đã được áp dụng ở những cơ sở nghiên cứu, sản xuất, về 
hiệu quả kinh tế của chúng và những sáng kiến, cải tiến kỹ 
thuật được đẻ xuất và áp dụng. 

- Bộ phiếu địa chỉ 

Được xây dựng để giúp đỡ các cơ sở sản xuất, các tổ 
chức, cơ quan biết được những địa chỉ cần thiết để giao 
dịch, mua bán như: 

~ Địa chỉ khách hàng 

- Địa chỉ cơ sở sản xuất các sản phẩm có liên quan. 

Nhiều viện, trung tâm thông tin chuyên ngành đã xây 
dựng các cơ sở dữ liệu đữ kiện phục vụ cho công tác lưu trữ 
và tra cứu thông tin được đầy đủ, nhanh chóng, kịp thời. 
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2.2.1.3. Hệ thống mục lục thư viện 

Hệ thống các mục lục thư viện - là một bộ phận quan 
trọng của bộ máy tra cứu, là công cụ tra cứu truyền thống 
không thể thiếu được, nó phản ánh toàn bộ kho tài liệu gốc 
hiện có trong thư viện, giúp bạn đọc tra tìm tài liệu một 
cách thuận lợi và nhanh chóng. Hệ thống mục lục của thư 
viện gồm: 

- Mục lục chữ cái 

Mục lục chữ cái phản ánh kho sách theo tên tác giả hoặc 
tén sách, vừa là phương tiện tuyên truyền sách, vừa là một 
Công cụ tra cứu thư mục và sử dụng chúng đơn giản. 

Mục lục chữ cái trả lời các câu hỏi: Trong thư viện có 
bao nhiêu tác phẩm và cụ thể là những tác phẩm gì của một 
tác giả nào đó ? Hoặc thư viện hiện đang lưu giữ những lần 
xuất bản nào cuả một tác phẩm 

- Mục lục phân loại 

Mục lục phân loại cũng giống như mục lục chữ cái, là 
một công cụ tra cứu rất quan trọng trong thư viện. 

Mục lục phân loại phản ánh kho tài liệu gốc của thư viện 
theo nội dung các ngành khoa học. Hiện nay trên thế giới 
nói chung và ở Việt Nam nói riêng tồn tại nhiều bảng phân 
loại khác nhau, khi tra tin cần tham khảo xem Thư viện 
đang sử dụng bảng phân loại nào để xử lý nội dung tài liệu 
(phân loại tài liệu) để khi tra tìm tin ta cũng phải theo ký 
hiệu của báng phân loại đó. 
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Vị dụ: 

Bảng phân loại BBK: Các ngành khoa học được sắp xếp 
theo vần chữ cái từ A - Z, 

Bảng phân loại DDC: 000 - 999... 

- Mục lục chủ đề 

Mục lục chủ đề phản ánh kho tài liệu gốc theo để mục 
chủ để. Cũng giống như khi phân loại tài liệu và xây đựng 
mục lục phân loại, thư viện sử dụng bảng để mục chủ đẻ 
nào để định chủ đẻ và tổ chức mục lục chủ đề thì cũng theo 
bảng đó để tra cứu thông tin. 

- Mục lực xuất bản phẩm định kỳ, tiếp tục 

Giúp cán bộ thư viện, người dùng tin theo dõi và tra cứu 
các xuất bản phẩm định kỳ (các loại báo, tạp chí ) thư viện 
thu thập được. 

- Mục lục liên hợp 

Mục lục liên hợp phản ánh tài liệu lưu giữ tại nhiều thư 
viện khác nhau trên địa bàn của một điạ phương nào đó 
hoặc là một ngành nào đó. 

- Mục lục địa chí 

Mục lục địa chí giúp cho việc tra cứu một cách nhanh 
chóng và thuận lợi những tài liệu / thông tin đã được xuất 
bản có đề cập tới địa phương, vùng, miền nào đó. 

2.2.1.4. Kho tài liệu tra cứu, ấn phẩm thông tin thư mục 

Số lượng và chất lượng của những tài liệu này ảnh hưởng 
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rất lớn tới hiệu quả phục vụ tra cứu của thư viện và cơ quan 
thông tin. Nếu tổ chức không tốt kho tài liệu tra cứu, cán bộ 
tra cứu có giỏi bao nhiêu cũng không thể trả lời được đầy 
đủ câu hỏi của người dùng tin. 

- Kho tài liệu tra cứu tra cứu 

Kho tài liệu tra cứu là kho đặc biệt trong hệ thống kho 
sách của thư viện. Kho này được tổ chức trên cơ sở rút ra từ 
kho chính những loại sách mang tính chất tham khảo, tra 
cứu thường xuyên được sử đụng đến, giúp cho cán bộ thông 
tín thư viện, người dùng tin tiện tra cứu hàng ngày tiết kiệm 
thời gian, công sức của họ. 

Kho tài liệu tra cứu gồm: 

+ Những tài liệu có tính chất chỉ đạo 

Tài liệu mang tính chất chỉ đạo là các tài liệu của Đảng 
và Nhà nước (Van kiện đại hội Đảng, các chỉ thị, nghị 
quyết, thông tư, quyết định của Đảng và nhà nước. về 
phương hướng phát triển kinh tế, khoa học, văn hoá, xã 
hội,... của đất nước nói chung và của ngành nói riêng, phù 
hợp với diện phục vụ của thư viện, cơ quan thông tin. 

Ví dụ: 

- Văn kiện Đại hội đảng lần thứ VỊ, VII,...IX, 

- Hiến pháp 

- Một số bộ luật, pháp lệnh : Bộ luật tố tụng hình sự, 
Luật xuất bản, Luật đầu tư nước ngoài, Pháp lệnh thư viện, 
Pháp lệnh lưu trữ,.. 
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- Các tác phẩm kinh điển của chủ nghĩa Mác - Lênin 
(toàn tập, tuyển tập, tác phẩm riêng biệt, các tập chuyên đẻ 
của C.Mác, F. Enghen, V. Lênin, Hồ Chí Minh,...) 

+ Bách khoa thư và niên giám (Encyclopedias and 
Book of the years) 

Bách khoa thư và niên giám cung cấp những kiến thức, 
tư liệu chính xác, cụ thể có hệ thống, về mọi vấn đẻ có liên 
quan tới đời sống chính trị, văn hoá, xã hội và khoa học. 
Hiện nay, ở Việt Nam chưa có bách khoa thư, song trên thế 
giới xuất hiện nhiều loại bách khoa thư từ thời cổ đại với 
các nhà bách khoa thư nổi tiếng như Aristotle (Ai Cập), 
Ploong the Elder (La Mã), Alexander Neckam, Thomas 
Elyot, Ephrainy Chambers (Anh),..Qua mỗi thời kì các 
Bách khoa thư lại hoàn chỉnh hơn về hình thức và phong 
phú hơn về nội dung, đáp ứng cho việc tra cứu thông tin của 
người dùng tin. Hiện nay, hầu hết các nước phát triển trên 
thế giới đều xuất bản bách khoa thư. Các ấn phẩm này đều 
được tái bản nhiều lần và ngày một hoàn thiện hơn. Ví dụ 
như mcyclapedia Brianicarl3 lần; Encyclopedia 
Americana: 6 lần, Đại bách khoa thư (Liên xô): 3 lần... 

Các bách khoa thư của thế giới được sử dụng rộng rãi ở 
Các thư viện Việt Nam. Các loại bách khoa thư giúp cho 
cấn bộ thư viện, bạn đọc tra cứu một cách thuận iợi và 
nhanh chóng. 

Theo nội dung Bách khoa thư có thể chía ra làm nhiều 
loại: 
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- Bách khoa thư có nội dung tổng hợp: hầu hết các nước 
đều xuất bản loại bách khoa thư loại này. 

kncyclopedia Britanica : (xuất bản lần 1: 1768 - 1771). 

Lần xuất bản lần thứ 16 của Encyclopedia Britanica gồm 
33 tập và ngoài hình thức ¡n mang tính truyền thống trên 
8!ấy, Britanica còn xuất bản dưới dạng điện tử (CD-ROM). 
Đritanica đổi mới, cập nhập thông tín kịp thời (mỗi năm đổi 
mới 10% lượng thông tin bằng các phụ trương (niên giám). 
Ví dụ: 

Britamca book Oƒ the year. Encyclopedia Bruamca, 
1993,...2001, 2002, 

Encyclopedia Americana 

Nhiều thư viện ở các tỉnh phía Nam có bách khoa thự 
Americana xuất bản năm 1964 gồm 30 tập. 

Phụ trương (niên giám) của Encyclopedia Americana là 
Americana Annual: An Encyclopedia of Curent Evenis. N - 
Y, Eneyclopedia Americana, 19....Khi tra cứu cần sử dụng 
các Phụ trương/ niên giám vì chúng cung cấp thông tin mới 
và cập nhật. 

Bách khoa thư chuyên để: Cung cấp những kiến thức, tư 
liệu chính xác, cụ thể có hệ thống, chỉ tiệt về vấn đẻ có liên 
quan tới một/một số lĩnh vực khoa học. Loại bách khoa thư 
này được xuất bản nhiều ở các nước và Việt Nam. 

Ví dụ: 

Bách khoa thư bệnh học, 
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Bách khoa thư Quân sự, 

Bách khoa thư Hà Nội,... 

+ Từ điển (Dictionaries) 

Cùng với bách khoa thư, từ điển cũng là công cụ tra cứu 
quan trọng cho đông đảo người dùng tin. 

Từ điển gồm có một số loại chính như: từ điển ngôn ngữ, 
từ điển thuật ngữ, Từ điển địa danh, từ điển tiểu sử/ nhân 
vật. 

Từ điển ngôn ngữ: 

Làm nhiệm vụ tập hợp đối chiếu và giải nghĩa các từ ngữ 
khái niệm của 2 hay nhiều ngôn ngữ trên cơ sở một ngôn 
ngữ khác. 

Ví dụ: 

Từ điển Anh - Việt 

Từ điển Việt - Nga 

Từ điển thuật ngữ: 

Từ điển thuật ngữ tập hợp và giải thích ngắn gọn những 
từ, ngữ, khái niệm thuộc một lĩnh vực khoa học hoặc một 
ngành sản xuất. 

Từ điển Xã hội học, 

Từ điển Toán học. 

Từ điển địa danh 

Từ điển địa danh ung cấp những thồng tin chỉ tiết liên 
quan tới các địa danh văn hoá, lịch sử, du lịch, hoặc tới các 
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địa phương, lãnh thổ của một quốc gia, một châu lục. 

Ví dụ: 

Từ điển địa danh văn hoá, lịch sử Việt Nam, 

Từ điển Hà nội địa danh. 

+ Sách tra cứu, số tay kỹ thuật (handbooks) 

Sách tra cứu cung cấp những kiến thức cơ bản nhất, cần 
thiết nhất về một ngành hoặc một lĩnh vực sản xuất cụ thể. 
Theo nội dung, có thể chia sách tra cứu thành 3 nhóm: sách 
tra cứu có nội dung tổng hợp, sách tra cứu chuyên đề và 
sách tra cứu về tiêu chuẩn, quy tắc, điều lệ. 

Sách tra cứu kỹ thuật. 

nách tra cứu kỹ thuật mang tính chất tổng hợp thường 
được xuất bản dưới dạng cẩm nang, sổ tay tra cứu để phục 
vụ cho một đối tượng cụ thể, nhằm cung cấp những kiến 
thức cô đọng và chủ yếu về từng ngành khoa học hoặc lĩnh 
vực sản xuất. 

Ví dụ: 

Sách tra cứu tóm tắt về vật lý, 

Sổ tay kỹ sư thiết kế chế tạo máy, 

Số tay thiết bị khoa học, 

Số tay phóng viên. 

sách tra cứu chuyên đề 

Sách tra cứu chuyên đề tập hợp tư liệu về từng vấn đề, để 
tài cụ thể của từng lĩnh vực hoạt động sản xuất: về nguyên 
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vật liệu, máy móc thiết bị, về tổ chức quản lý sản xuất, về 
phương pháp canh tác,... Sách tra cứu chuyên đề có thể trình 
bày những vấn đề rộng, liên quan đến nhiều ngành sản xuất. 

Ví dụ: Sách tra cứu về ổ bị, khớp nối, 

Hoặc đi sâu vào những đề tài hẹp. 

Ví dụ: Bảng tra số liệu kết cấu thép, 

Chí dẫn về phân bón, 
Bảng tra chữ nôm. 

Sách tra về tiêu chuẩn, quy tắc, thể lệ: 

Sách tra về tiêu chuẩn, quy tắc, thể lệ là loại tài liệu tập 
hợp yêu cầu, điều kiện cơ bản về một lĩnh vực hoạt động 
nào đó đã được cơ quan có thêm quyền ban hành và sử 
dụng. 

Ví dụ: Văn bản pháp quy về thư viện 

Thể lệ giao thông đường biển 

Điều lệ trật tự an toàn giao thông vận tải đường bộ. 

+ Niên biểu, lịch biểu, niên giám 

Loại tài liệu này cung cấp các số liệu, kiến thức cho 
NDT về các lĩnh vực kinh tế, văn hoá, xã hội trong những 
khoảng thời gian nhất định. 

Ví dụ: 

Niên giám Thông kê (Xuất bản hàng năm) 

Niên giám công thương Hà Nội - Hải Phòng - TP. Hồ 
Chí Minh 1997-1998. 
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Nông lịch. (Xuất bản hàng năm) 

Đáng kể là trong loại tài liệu này là almanach: theo 
nghĩa tiếng Việt có nghĩa là là niên lịch, niên giám, được 
xuất bản trong năm. Kiến thức trong almanach tổng hợp 
như một cuốn bách khoa thư thu nhỏ. 

Almanach - Sách lịch phổ thông (Xuất bản hàng năm) 
Almanach - Những nền văn minh thế giới 

+ Nguồn tra cứu vẻ các cơ quan, tổ chức, tiểu sử và 

địa lý 
. Nguồn tra cứu về các cơ quan, tổ chức (Sách dẫn) 

Sách dẫn về các cơ quan, tổ chức là một trong những 
nguồn tra cứu chính. Nguồn tra cứu về các tổ chức - cơ 
quan là danh mục tên của các cơ quan - tổ chức sắp xếp 
theo trật tự chữ cái thuộc lính vực hoại động, sau đó theo 
trật tự chữ cái tên của các cơ quan: bao gồm thông tin chỉ 
tiết, đầy đủ tên cơ quan / chí nhánh / đại điện, địa chỉ, số 
điện thoại, tên của thủ trưởng cơ quan, chức năng, nhiệm vụ 
của cơ quan, về hành chính tổ chức, ví dụ như: lịch sử hình 
thành cơ quan / tổ chức, lĩnh vực hoạt động, các loại dịch vụ 
và các tài liệu có liên quan đã được ¡n ấn. 

Ví dụ: 

Các thư viện Việt Nam. 

Directory of special librarlesin Australia. 


World of learning. 
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Press, radio and TV guide. 

Nguồn tra cứu về tiểu sử 

Nguồn tra cứu về tiểu sử cung cấp những tin tức ngắn 
gọn về cuộc đời và sự nghiệp của các nhà hoạt động chính 
trị, khoa học, văn hoá, xã hội nổi tiếng trong nước và trên 
thế giới. Tuy nhiên nhiều nguồn tra cứu thông tin rất chỉ tiết 
đầy đủ về cuộc đời và sự nghiệp của các nhân vật đó như: 
cuộc đời riêng (liệt kê các mốc thời gian về tiểu sử một 
cách chi tiết nhất, cách phát âm tên theo ngôn ngữ gốc., sở 
thích, nghề nghiệp, thành viên của các hiệp hội, công trình 
đã công bố, có đăng kèm theo chân dung hoặc ảnh của nhân 
vật. Thông thường loại tài liệu này được xuất bản dưới dạng 
từ điển nhân vật. 

Ví dụ: 

Từ điển nhân vật lịch sử Việt Nam. 

Tác gia văn học Thăng long. 

330 danh nhân thế giới. 

Nhiều nước, nhiều tổ chức quốc tế tiến hành xuất bản 
các ấn phẩm định kỳ, ấn phẩm tiếp tục hoặc các thư mục 
tiểu sử (Biography index, biography directories) về các 
nhân vật và chính khách trong nước và trên thế giới: 

Vídụ: Intemational whos who (Xuất bản tại Anh). 

Whos who in America (Xuất bản tại Mỹ). 

Austraian dictionary of biography (Xuất bản tại 
Ôxtralia) 
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Nguồn tra cứu về địa lý 

Đây là nguồn tra cứu thông tin về các địa danh bao gồm: 
các thành phố, thị trấn, làng, xã, sông ngòi, núi và hồ. 
Nguồn tra cứu về địa lý thường được xuất bản dưới dạng: 

Bản đô: 

Là loại tài liệu mô tả sơ lược về kích thức bề mặt của thế 
giới, châu lục hoặc một địa phương cụ thể. Có nhiều loại 
bản đồ được xuất bản như: bản đồ địa lí, bản đồ chính trị, 
bản đồ kinh tế, bản đồ chuyên đề,... 

Ví dụ: Bản đồ khoáng sản Việt Nam 

Bản đồ thế giới 

Bản đồ Hà Nội 

Tập bản đồ (Atlases): 

Bao gồm các loại bản đồ và chỉ dẫn giúp cho người dùng 
tin tra cứu những thông tin trên bản đồ. Cũng như bản đồ, 
tập bản đồ có nhiều loại: tập bản đồ thế giới, tập bản đồ 
quốc gia, tập bản đồ lịch sử, tập bản đồ chỉ dẫn đường và 
phố, tập bản đồ kinh tế,... 

Atlat bản đồ thế giới (Dùng cho học sinh phổ thông) 

Sách tra cứu địa lí : 

Loại tài liệu tra cứu này liệt kê các địa danh và những 
địa phương trực thuộc. Sách tra cứu địa lí là nguồn tra cứu 
quan trọng vì chúng cung cấp những thông tin liên quan 
đến sự kiện, dữ liệu: vị trí địa lí, diện tích, đân số, cách phát 
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âm đúng,... liên quan tới địa đanh, mô tả chúng ở thời hiện 
tại cũng như cung cấp những thông tin mang tính lịch sử. 

Ví dụ: : 

Từ điển Địa danh Văn hoá Việt Nam 

Từ điển Địa danh Lịch sử - Văn hoá Việt Nam 

Các nguồn tra cứu địa lí khác: Bách khoa thư, Niên 
giám, Từ điển bách khoa,..cũng có thể tra cứu thông tin 
liên quan tới các địa danh 

- Ấn phẩm thông tỉn - thư mục 

Ấn phẩm thông tin - thư mục cung cấp cho người dùng 
tin và cán bộ thông tin - thư viện những tin tức về nguồn tài 
liệu xuất bản trong nước và trên thế giới, không phân biệt 
tài liệu đó có trong thư viện hay không. 

Ấn phẩm thông tin thư mục gồm: các bản thư mục, tạp 
chí tóm tắt, thông tin nhanh (Express informations), thông 
tin tín hiệu (Signal imformations), tổng quan.... là tài liệu 
cấp 2, cấp 3 do các cơ quan thông tin thư viện biên soạn 
trên cơ sở phân tích, xử lý, tổng hợp tài liệu cấp Ï (tài liệu 
gốc). 

Trên thế giới có nhiều ấn phẩm thông tin thư mục nổi 
tiếng, có uy tín được xuất bản và phổ biến rộng rãi như: 

Chemical Abstracts (Mỹ). 

Biological Abstracts (Mỹ). 

Agrindex (FAO) 
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Bulletin Signalitique (Pháp) 

Referativnuưi zhumal (Nga). 

Japanesce Science Reviews (Nhật) 

Ỏ Việt Nam các cơ quan thông tin thư viện cũng biên 
soạn và xuất bản nhiều ấn phẩm thông tin thư mục như: 

Trung tâm Thông tín Khoa học và Công nghệ Quốc gia 
xuất bản: 

- Thông báo sách mới 

- Tạp chí tóm tất tài liệu khoa học và công nghệ Việt 
Nam 

- Tổng quan khoa học - công nghệ - kinh tế,... 

Thư viện Quốc gia xuất bản: 

- Thư mục quốc gia Việt Nam, 

- Thông tin Văn hoá nghệ thuật,..... 

Viện thông tin khoa học xã hội xuất bản. 

~ Thư mục sách ngoại văn 

- Thông báo sách mới... 

Trung tâm thông tín Cục sở hữu trí tuệ xuất bản: 

- Công báo sở hữu trí tuệ. 2 tập. 

Ngoài ra các thư viện tỉnh, thành phố còn biên soạn các 
thư mục địa chí. 

Với sự phong phú về nội dung và đa dạng về hình thức, 
tài liệu tra cứu đóng vai trò quan trọng trong việc tổ chức bộ 
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máy tra cứu của thư viện và phục vụ tra cứu cho người dùng 
tin. Nó không những chỉ giúp tra cứu tài liệu / thông tin cân 
thiết mà còn là cơ sở để tìm hiểu về những khái niệm, thuật 
ngữ khoa học và nhiều vấn để cơ bản khác nhằm đáp ứng 
đầy đủ hơn những yêu cầu về thông tin và tra cứu của bạn 
đọc. 

2.2.2. Bộ máy tra cứu bán tự động hoá 

Bộ máy tra cứu bán tự động được xây dựng trên nguyên 
tác lưu trữ thông tin theo tài liệu hoặc theo nội dung trên 
các phiếu lỗ mép và phiếu lỗ soi . 

2.2.2.1. Phiếu lỗ mép 

Phiếu lỗ mép là một hệ thống lưu trữ thông tin theo 
nguyên tắc "xếp theo tài liệu", nghĩa là mỗi tài liệu được 
trình bày trên một phiếu. Phiếu này là thành phần chính của 
bộ nhớ. Phiếu gồm có 2 vùng: 

- Vùng giữa: dùng để mô tả thư mục của tài liệu 

- Vùng xung quanh mép phiếu: là vùng đục lỗ theo một 
mã số đã quy định. Người ta có thể ghi dưới dạng các lỗ 
khuyết những đặc trưng nội dung và khái niệm của tài liệu, 
nhằm giúp cho việc tra cứu một cách nhanh chóng. Khi cần 
tra cứu tài liệu về một vấn đề nào đó, người tìm tin sử dụng 
que xiên vào lỗ tương ứng từng phiếu một với đặc trưng 
định tìm, rồi cho tập phiếu rơi tự do. Những phiếu có bấm 
lỗ khuyết sẽ rơi xuống - đó chính là kết quả của sự lựa 
chọn. 
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Nếu một đặc trưng được trình bày bằng nhiều lỗ và nếu 
muốn tra cứu theo nhiều đặc trưng, thì phải lặp lại phương 
pháp trên cho mỗi lõ. 

Phiếu lỗ mép có thể được làm bằng bìa cứng, bìa mềm, 
giấy Bnstol, có kích thước từ 75 x 125 mm đến 210 x 
297mm. Các lỗ có đường từ 2,5 - 3mm và khoảng cách giữa 
chúng là 5,6 mm hoặc 6,35mm. 

Mã số đăng ký: 

Mã số có thể là Số hoặc Chữ cái, tuỳ theo mã số được tạo 
nên trong quá trình xây dựng phiếu. Có nhiều loại mã số 
được sử dụng trong quá trình mã hoá tài liệu, có những cách 
mã hoá cho phép đăng ký một số lượng tin lớn và có khả 
năng sử dụng một cách rất mềm dẻo và linh hoạt. Một vài 
mã số thông dụng như 1.2.4.7., mã tam giác, mã chữ cái,... 

2.2.2.2. Phiếu lỗ soi 

Phiếu lỗ soi được xây dựng ngược lại với phiếu lỗ mép, 
trên cơ sở mỗi phiếu ứng với một từ khoá hoặc từ chuẩn đặc 
trưng cho nội dung tài liệu. Mỗi lỗ tượng trưng cho một số 
đăng ký của tài liệu trong hệ thống. Để ghi một tài liệu vào 
bộ nhớ ta phải đục lỗ ở vị trí đành cho nó trong những phiếu 
ứng với khaí niệm mà tài liệu đó có đề cập tới. Khi cần tra 
cứu tài liệu có liên quan tới một từ khoá, từ chuẩn nào đó, ta 
chỉ việc đặt chồng các phiếu có cùng đặc trưng trước nguồn 
sáng. Những tài liệu phù hợp với yêu cầu sẽ là những phiếu 
có những vị trí đục lễ trên toàn bộ những phiếu chồng lên 
nhau và vì vậy mà ánh sáng có thể xuyên qua được. 
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Phiếu lỗ soi được làm bằng giấy bristol nhẹ có nhiều loại 
kích thước khác nhau. Trên mỗi phiếu có một mạng các vị 
trí được xây dựng bảng phương pháp toa độ. Mỗi vị trí Ứng 
với một số đăng ký của tài liệu đã được gán cho từ trước. Số 
lượng các vị trí trên mỗi phiếu ứng với số lượng của tài liệu 
có thể đưa vào bộ nhớ. Dung lượng của mỗi phiếu có thể từ 
5000 tài liệu (như mẫu phiếu SPHINXO) hoặc 14000 tài 
liệu (như mẫu phiếu SELECTO) 

Trong mẫu SELECTO, mỗi phiếu có kích thước 150 x 
200mm. Phiếu bao gồm các ô vuông đánh số theo hoành 
độ từ 0 đến 99 và theo tung độ từ 0 đến 139. Như vậy sẽ có 
14000 vị trí ứng với mỗi ô vuông. 

Lưu trữ thông tin: 

Mỗi tài liệu trước khi đưa vào hệ thống đều được ghi một 
số đăng ký theo thời gian. 

Ví dụ: Muốn đục lỗ tài liệu ”Bệnh lao phổi ở miền núi 
Việt Nam “xuất bản năm 1987, ta lấy các phiếu tương ứng 
với các từ khoá: 

- Lao phối 

- Miền núi 

- Việt Nam 

- Năm 1987 

Nếu tài liệu đưa vào hệ thống có số thứ tự 5498 thì mỗi 
phiếu trích ra sẽ được đục lỗ ở ö vuông có toạ độ: 

X=54, Y=98. 
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Việc đục lỗ có thể thực hiện bằng máy đục lỗ điện tử. 

Việc đọc được thực hiện bằng cách sử dụng một khung 
chiếu sáng, cho phép nhìn thấy dễ dàng các ô có lỗ chung 
với nhau trên các phiếu chồng nhau. Mỗi lần có thể chồng 
khoảng 30 phiếu lên nhau, tuy nhiên điều này ít gặp trong 
thực tế. 

Hiện nay cùng với sự phát triển rất mạnh mẽ của công 
nghệ thông tin, trong hoạt động của các cơ quan thông tin - 
thư viện hầu như không còn áp dụng lưu trữ và tra cứu 
thông tin bán tự động nữa, mà hoặc họ sử dụng hình thức 
lưu trữ và tra cứu thông tin truyền thống, hoặc sử dụng hình 
thức lưu trữ và tra cứu thông tin tự động hoá. Tổ chức hình 
thức lưu trữ và tra cứu thông tin bán tự động tồn tại không 
lâu, nay nó chỉ còn mang tính lịch sử. 

2.2.3. Bộ máy tra cứa thông tin tự động hoá 

Ngày nay với sự bùng nổ thông tin, người ta khó có thể 
chỉ dựa những công cụ tìm tin thủ công (như các bộ phiếu) 
để tìm kiếm nhanh chóng và đầy đủ những thông tin cần 
thiết. Để giải quyết tình trạng này người ta đã xây dựng 
những bộ máy tra cứu thông tin tự động hoá. Bộ máy tra 
cứu thông tin tự động hoá thường được gọi là hệ thống tìm 
tin tự động hoá. 

Thuật ngữ “hệ thống tìm tín" nói chung được sử dụng 
để chỉ một hệ thống mà nó lưu trữ thông tin và cho phép tìm 
lại thông tin đã lưu trữ. Trongmột chừng mực nào đó và 
theo theo quan niệm truyền thống, một tủ mục lục thư viện, 
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một tạp chí tóm tất (như Chemical Abstracts hoặc 
Referativnyi Zhumal), tệp thư mục,..có thể được coi như 
một hệ thống tìm tin thủ công. Tuy nhiên, theo quan niệm 
hiện đại, hệ thống tìm tin phải là hệ thống được tin học hoá 
có sử dụng máy tính điện tử, phần mềm lưu trữ và tìm tin và 
các cơ sở đữ liệu. 

Hệ thống tìm tin tự động hoá là hệ :hống có khả năng 
lim trữ, tìm lại và bảo trì thông tin được tin học hoá. Hệ 
thống tìm tin tự động hoá bao gôm phân cứng, phân mêm, 
các công cụ ngữ nghĩa phục vụ xử lý thông tin và yêu cẩu 
tin, các cơ sở dữ liệu để người lìm tin truy cập và tìm lại 
được những thông tin đã lưu trữ trong đó và nhân viên làm 
việc với hệ thống. 

2.2.3.1 Thành phần hệ thống tìm tin tự động hoá 

Những thành phần của hệ thống tìm tin tự động hoá có 
quan hệ tương tác với nhau và mỗi thành phần được thiết kế 
để thực hiện những chức năng nhất định. Hệ thống tìm tin 
tự động hoá có thể là hệ thống đơn giản chỉ gồm máy tính 
điện tử độc lập, phần mềm và cơ sở dữ liệu. Nhưng hệ 
thống tìn tin tự động hoá có thể là hệ thống rất phức tạp với 
nhiều thành phần hợp thành như trường hợp các dịch vụ 
thông tin trực tuyến. Về tổng quát, hệ thống tìm tin tự động 
hoá bao gồm những thành phần cơ bản như sau: 

- Hệ thống công cụ xử lý lôgic ngữ nghĩa; 

- Phương tiện kỹ thuật; 

- Cơ sở đữ liệu; 
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- Nhân viên làm việc với hệ thống. 

Hệ thống công cụ xử lý lôgic ngữ nghĩa bao gồm tập hợp 
các công cụ dùng cho công tác xử lý hình thức và xử lý nội 
dung thông tin như các quy định về mô tả tài liệu (như các 
quy tắc mô tả thư mục AACR2, ISBD,...), các ngôn ngữ tìm 
tin (như các ký hiệu phân loại, từ điển từ chuẩn, đề mục chủ 
đề, bộ từ khoá có kiểm soát.. .), các khổ mẫu dữ liệu (như 
MARC 21, UNIMARC, CCEF....), các quy tắc xử lý thông 
tin, nhập đữ liệu,....Những công cụ xử lý lôgic ngữ nghĩa là 
thành phần đóng vai trò cực kỳ quan trọng trong việc phân 
tích, trình bày và tổ chức thông tin cho việc tìm kiếm lại 
thông tin được lưu trữ sau này. Những công cụ của bộ máy 
lôgic ngữ nghĩa còn có vai trò quan trọng trong: việc phân 
tích yêu cầu tin và xây dựng biểu thức tìm tin dể đưa vào hệ 
thống tìm tin. 

Phương tiện kỹ thuật là thành phần rất quan trọng của hệ 
thống tìm tin và bao gồm phần cứng, phần mềm, các 
phương tiện viễn thông. 

Phần cứng bao gồm các máy tính điện tử, các thiết bị 
ngoại ví, các bộ nhớ (lưu trữ thông tin) và các thiết bị mạng. 
Máy tính điện tử là một thiết bị điện tử xử lý rất nhanh 
thông tin đưa vào dưới sự điều khiển của các chương trình 
lưu trữ trong bộ nhớ. Máy tính điện tử có những khả năng 
rất mạnh trong quản lý, xử lý và trao đổi dữ liệu. 

Bộ nhớ ngoài là thiết bị để lưu trữ chương trình và thông 
tin. Trong hệ thống tìm tin tự động hoá người ta sử dụng 
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các bộ nhớ ngoài như băng từ, đĩa từ và đĩa quang. Băng từ 
là băng nhựa có phủ lớp vật liệu có khả năng nhiễm từ. Mặt 
băng rộng 12,7 mm được chia thành 7 hay 9 rãnh từ, trong 
đó rãnh cuối cùng được sử dụng để kiểm tra. Một băng từ 
đài khoảng 730 m có khả năng lưu trữ đến 46 triệu ký tự. 
Băng từ chủ yếu được sử dụng để sao lưu dữ liệu. Đĩa từ là 
một đĩa bằng kim loại hoặc chất dẻo, trên mặt đĩa có phủ 
lớp vật liệu có khả năng nhiễm từ. Việc lưu trữ thông tin 
trên đĩa từ được thực hiện trên cơ sở công nghệ điện tử. Đĩa 
từ có 2 loại là đĩa cứng và đĩa mềm. 

Đĩa quang (optical disc) là vật mang tin quang học. Đĩa 
quang được tạo ra từ đầu những năm 80 của thế kỷ XX. Đĩa 
quang được sử dụng nhiều trong hoạt động thông tin thư 
viên là đĩa CD-ROM (tên viết tắt tạo từ từ tiếng Anh 
Compact Disc - Read Only Memory). Đĩa CD-ROM có 
dung lượng lưu trữ khoảng 650 Mb và được sử dụng để phổ 
biến các cơ sở dữ liệu hoặc các tài liệu toàn văn. Để đọc 
được đĩa CD-ROM, máy tính cần có thiết bị đặc biệt là đầu 
đọc CD-ROM. Hiện nay có những thiết bị có khả năng đặt 
vào đó đồng thời nhiều đĩa CD-ROM và đọc nhiều đĩa CD- 
ROM. Đó là các tháp CD-ROM (CD-ROM Tower) và CD- 
ROM Jukebox. 

Phần mềm bao gồm những phần mềm hệ thống (như hệ 
điều hành) và phần mềm ứng dụng (như chương trình quản 
trị mạng, chương trình quản trị cờ sở dữ liệu, chương trình 
viễn thông). - 
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Mạng máy tính đã trở thành một công cụ chiến lược 
trong hoạt động của hầu hết các tổ chức, doanh nghiệp. Sự 
phát triển của mạng máy tính gắn liền với sự phát triển của 
công nghệ máy tính điện tử, công nghệ thông tin và công 
nghệ viễn thông. Mạng máy tính là là mỘI tập hợp các máy 
tính được kết nối với nhau bởi các đường truyền vật lý theo 
một kiến trúc nào đó. Những thiết bị mạng, ngoài các máy 
tính điện tử và các thiết bị viễn thông có thể bao gồm cạc 
(card) mạng, các đường truyền dữ liệu (cáp đồng, cáp 
quang), bộ tập trung (HUB), bộ định tuyên (Router), bộ 
chuyển mạch (Switch). 

Ngày nay với sự phát triển của máy tính điện tử, công 
nghệ mạng máy tính và viễn thông đã tạo ra các mạng 
thông tin máy tính. Các thiết bị viễn thông rất da đang. Một 
trong những thiết bị viên thông được sử dụng rộng rãi trong 
khai thác các mạng thông tin máy tính là Modem. Đây là 
thiết bị cho phép kết nối máy tính điện tử với mạng thông 
tin máy tính thông qua đường điện thoại. 

Cơ sở dữ liệu là tập hợp có cấu trúc các các dữ liệu về 
đối tượng được quản lý thông tín. Cơ sở đữ liêu là một 
thành phân cơ bản của hệ thống tìm tin tự động hoá. Nhiều 
dịch vụ thông tin có thể lưu giữ trong hệ thống máy tính 
của mình nhiều cơ sở dữ liệu tạo thành ngân hàng dữ liệu, 
còn gọi là những nhà bán hàng dịch vụ trực tuyến (vendor) 
hoặc các dịch vụ tìm tin (search services). Hệ thống tìm tin 
có thể có nhiều loại cơ sở dữ liệu khác nhau, từ cơ sở dữ 
liệu thư mục, cơ sở dữ liệu chỉ dẫn đến các cơ sở đữ liệu 
dạng dữ kiện (số, văn bản-số), tính chất, và toàn văn. 
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Cơ sở dữ liệu được tạo ra, quản lý và khai thác bằng một 
hệ thống phần mềm gọi là quản trị cơ sở dữ liệu. Hệ quản 
trị cơ sở dữ liệu cho phép người sử dụng có thể thực hiện 
những chức năng cơ bản sau đây trong việc quản lý dữ liệu: 


- Mô tả dữ liệu 
- Cạp nhật và bảo trì dữ liệu 
- Tìm kiếm đữ liệu lưu trữ 










Kho tài 
liệu gốc 


Người sử 
dụng 


Hình I. Mô hình hoạt động đơn giản hệ thống tìm tin 

Đối tượng quản lý thông tin trong cơ sở dữ liệu rất đa 
dạng. Đó có thể là các thông tin về những bài tạp chí, sách, 
tuyển tập, luận án tiến sỹ, sáng chế, tiêu chuẩn, hồ sơ cá 
nhân. hồ sơ công ty, số liệu thống kê, công thức hoá học, 
cấu tạo các chất, v.V.... 

Con người làm việc với hệ thống gồm những nhóm cán 
bộ chuyên môn khác nhau có trách nhiệm thiết kế, xây 
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dựng, vận hành, bảo trì, khai thác hệ thống và người tìm tin 
khai thác hệ thống để đáp nhu cầu tin của khách hàng hoặc 
của bản thân. 

Mô hình hoạt động đơn giản của một hệ thống tìm tin có 
thể được trình bày trong hình I. 

2.2.3.2 Phân loại hệ thống tìm tin tự động 

Người ta có thể phân loại hệ thống tìm tin tự động hoá 
theo mục đích cung cấp dịch vụ (cho nhu cầu nội bộ hoặc 
đáp ứng nhu cầu bên ngoài), theo người cung cấp, theo loại 
hình thông tin của hệ thống. 

- Phân loại theo mục đích cung cấp dịch vụ. 

Theo mục đích cung cấp địch vụ, có thể phân biệt hai 
loại hệ thống tìm tin tự động hoá: hệ thống tìm tín nội bộ 
(In-house system) và hệ thống tìm tin kinh doanh. Hệ thống 
tìm tin nội bộ được xây dựng nhằm đáp ứng nhu cầu tìm tin 
của người dùng tin thuộc tổ chức nhất định. Ví dụ mục lục 
thư viện truy cập trực tuyến (OPAC) là một dang hệ thống 
tìm tin tự động hoá nội bộ vì nó được xây dựng để đáp ứng 
nhu cầu tra cứu tìm tin của bạn đọc của thư viện. Hệ thống 
tìm tin tự động hoá kinh doanh hoạt động dựa trên cơ chế 
thị trường. Những hệ thống này cung cấp dịch vụ truy cập 
đến các cơ sở dữ liệu hoặc ngân hàng dữ liệu cho người sử 
dụng. Ví dụ cho hệ thống này là các dịch vụ thông tin trực 
tuyến. Người sử dụng thanh toán phí dịch vụ căn cứ vào 
mức độ khai thác sử dụng dịch vụ (như theo câu hỏi, theo 
số biểu ghi được xem, được tải về, thời gian truy cập, loại 
hình cơ sở dữ liệu truy cập. Những hệ thống này thường 
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được gọi là các dịch vụ tìm tim hoặc dịch vụ trực tuyến. 


- Phân loại theo phương thức truy cập 


Theo phương thức truy cập cơ sở dữ liệu người có thể 
chia hệ thống tìm tin thành: 


+ Hệ thống tìm tin cục bộ 


+ Hệ thống tìm tin trực tuyển 


+ Hệ thống tìm tin trên CD-ROM 


+ Hệ thống thông tin toàn cầu (Internet) 


Bảng 1. Đặc điểm của một số hệ thông tìm tin 


Hệ thống tim 
tin 


Hệ thống tìm 
tin trực tuyến 


Đặc tính 
người sử 
dụng 


Chuyên gia 


¡ tìm tin; 


Người quản 


| trị, Người 


dùng tin đầu 
cuối 

Người dùng 
tin đầu cuối 
Chuyên gia 
tìm tin 





Intermet 


Người dùng 
tin đầu cuối, 
Công chúng 


Môi trường sử 
dụng 


Các trường 
đại học, các 
trung tâm 
thông tin, thư 
viên 


Các trường 
đại học, các 
trung tâm 
thông tin, thư 
viện 

Các cơ quan 
nghiên cứu 
KH 


Chức năng 


Tìm tin, cung 
cấp thông tin 
thư mục, dữ 
kiện, toàn 
văn. 


Tim tin, cung 
cấn thông tin 
thư mục, đữ 
kiện, toàn 
văn 


Thông tin đại 
chủng, toàn 
văn 

Phương tiện 
liên lạc 
(email) 


Công nghệ 
truy cập 


Mạng máy 
tỉnh; 

Kênh thuê 
bao riêng; 
Intarmet 


Đồ hoa, trên 
nền 
Windows, đa 
phương tiện 


Mạng viễn 
thông, 
TCPHP, 

Tựa Web 
(Web based) 
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Hệ thống tìm tin cục bộ cung cấp khả năng truy cập đến 
các cơ sở dữ liệu lưu trữ trên máy tính điện tử tại chỗ trong 
khi hệ thống tìm tin trực tuyến cung cấp khả năng truy cập 
đến các cơ sở dữ liệu lưu trữ trên máy tính điện tử ở xa 
thông qua mạng máy tính và hệ thống viễn thông. Cùng với 
sự phát minh ra CD-ROM như mội loại hình vật mang tin 
quang học, rất nhiều hệ thống tìm tin trực tuyến và các nhà 
sản xuất cơ sở đữ liệu đã đưa cơ sở dữ liệu lên CD-ROM và 
phổ biến chúng cho người sử dụng theo cơ chế kinh doanh. 
Những nguyện lý và kỹ thuật tìm tin trên CD-ROM. trên hệ 
thống cục bộ và trực tuyến về cơ bản không khác biệt. 
Điểm khác biệt giữa hệ thống tìm tin trực tuyến với những 
hệ thống khác là sự có mặt của mạng viễn thông để hỗ trợ 
truy cập hệ thông theo phương thức từ xa. 

Gần đây với sự phát triển nhanh chóng của công nghệ 
thông tin và công nghệ viễn thông đã tạo ra một mạng 
thông tin toàn cầu - mạng Internet. Đặc biệt, với sự phát 
mình ra World Wide Web (còn gọi tất là Web hoặc 
WWW), khu vực hoạt động của hệ thống tìm tín trực tuyến 
đã mở rộng. Internet và Web đã giúp làm cho thông tin trên 
tạng có thể được truy cập bởi bất cứ ai nếu máy tính của 
họ được kết nối với Internet. Điều này đã dân đến sự thành 
hình khái niệm hệ thống thông tin toàn cầu. Khai thác hệ 
thống này được trình bày ở phần tìm tin trên Internet. Một 
số đặc điểm của những hệ thống tìm tn tr động hoá đực trình bày 
trong báng Ì. 
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Bảng 2. Phân loại hệ thống tìm tin theo thế hệ 













Thể hệ. 


Hệ thống tim 
tin thế hệ I 


Loại thông tỉ 


Thông tin thư 
mục 








- Sử dụng hệ điều hành DOS hoặc 
mạng; 

- Người sử dụng là cán bộ chuyên 
nghiệp, đòi hỏi có nhiều kỹ năng 

~ Ví dụ: các dịch vụ trực tuyến 
- Sử dụng hệ thống thực đơn; 
- Sử dụng đơn giản hơn 
Người sử dụng là chuyên nghiệp 
hoặc người dùng đầu cuối 
- Hệ thống trên CD-ROM 
- Sử dụng giao diện đồ hoạ; 

- Sử dụng chuội (Click) 

- Sử dụng đơn giản 

- Dùng trình duyệt Web để khai thác 


- Các hệ thống trên CD-ROM và trên 
Internet. 














Hệ thống tìm 
tin thế hệ II 


Thông tin thư 
mục và toàn văn 































Hệ thống tìm 
tin thế hệ IIl 


Thông tin đa 
phương tiện 
(Multimedia) 






- Phân loại theo thế hệ của hệ thống tìm tin 

Theo thế hệ của hệ thống, người ta phân hệ thống tìm tin 
tự động hoá thành 3 loại (xem bảng 2). 

+ Hệ thống tìm tin thế hệ thứ nhất: là hệ thống tìm tin thư 
mục. 

+ Hệ thống tìm tin thế hệ thứ hai: là hệ thống tìm tin toàn 
văn. 

+ Hệ thống tìm tin thế hệ thứ ba: là hệ thống tìm tin đa 
phương tiện. 
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Tuy nhiên việc phân loại cũng có tính chất tương đối vì 
một hệ thống có thể thực hiện nhiều chức năng. 

2.2.3.3. Cơ sở dữ liệu 

Cơ sở dữ liệu là một tập hợp có cấu trúc các dữ liệu về 
đối tượng được quan lý, lưu trữ đồng thời trên các vật mang 
tin của máy tính điện tử và được quản lý theo phương thức 
thông nhất nhằm giúp cho việc tìm tin được để dàng và 
nhanh chóng. 

Cơ sở dữ liệu là tập hợp theo phương thức thống nhất 
những biểu ghi (record) ở dạng máy tính đọc được và cho 
phép tìm kiếm theo chế độ đối thoại. Nhiều hệ thống tìm tin 
trực tuyến trên thế giới dùng thuật ngữ "file" để chỉ một cơ 
sở dữ liệu nào đó trong hệ thống. 

Biểu ghi là tập hợp dữ liệu có cấu trúc được tạo thành bởi 
một số xác định các thành phần gọi là rrường (field}. Biểu 
ghi của cơ sở dữ liệu thư mục là đữ liệu được cấu trúc mà ở 
đó mỗi thuộc tính mô tả từng đối tượng quản lý của cơ sở 
đữ liệu được quy định bảng một trường. 

Trường là thành phần rất cơ bản của biểu ghi. Trường 
thường được xác định bằng nhãn trường (field tag). Đó là 
một dãy ký tự nối tiếp nhau (là ký tự chữ cái hay một cụm 
chữ số) để xác định mô tả một tiêu thức hay một thuộc tính 
của đối tượng. 

Ví dụ, các trường của biểu ghi thư mục theo khổ mẫu 
MARC 21 được xác định bằng con số như OO1, 003, 005, 
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100, 110, 200, 245, 600, v.v...Các trường của cơ sở dữ liệu 
xây dựng bằng chương trình CDS/ISIS cũng được thể hiện 
bằng các cơn số. 

Nội dung của mỗi trường (nói cách khác là của mỗi 

thuộc tính) là giá trị trường. Một biểu ghi của cơ sở dữ liệu 

là tập hợp những giá trị của các trường mô tả một đối tượng. 

Ví dụ: biểu ghi thư mục của một cơ sở dữ liệu về sách có 
thể có các trường sau: 

- Tiêu để tác giả 

- Nhan đề và thông tin trách nhiệm 

- Lần xuất bản 

- Địa chỉ xuất bản (nơi xuất bản, nhà xuất bản và năm 
xuất bản) 

- Thông tin về đặc trưng vật lý (số trang, khổ cỡ,...) 

- Số đãng ký cá biệt (số đăng ký tài sản). 

- Ký hiệu phân loại 

- Ký hiệu xếp giá (Ký hiệu phân loại, ký hiệu tác giả, 
năm xuất bản) 

- Từ khoá 

- Tóm tất 

Mỗi trường đữ liệu đó sẽ được xác định bởi một nhãn 
trường. Trong nhiều cơ sở dữ liệu thư mục, trường đữ liệu 
còn có thể được chia thành các trường cơn (subfields). Một 
trường còn thể có nhiều trường con. 
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Tập hợp các biểu ghi thư mục như vậy được tổ chức 
thành cơ sở dữ liệu thư mục. Thông tin được lưu trữ trong 
các cơ sở dữ liệu là dạng thông tin số hoá. Bảng 3 trình 
bày đăng cấp của các thành phần dữ liệu của ngân hàng dữ 
liệu. 

Bảng 3. Thí dụ về đẳng cấp của các thành phần đữ liệu 


Thành phần dữ liệu 
LBE........ |hoậe0 


BÉ ————_ |01001100 
Nơi xuất bản 
Trường 


F _ "¬ 


[Biểugi |-Nhanđ | 
- Tác giả cá nhân E—————~ 
- Địa chí xuất bản | 
- Đặc trưng số lượng | | 
Cơ sở dữ liệu - Cơ sở dữ liệu BOOK 


của Mạng VISTA có 
90.000 biểu ghi 















^aHà Nỗi 
^aHà Nọi^bNXB Khoa ¡ 
học và Kỹ ị 
Thuật^c 1990 




























Gồm nhiều CSDL như 
BOOK, TAPCHI, 
5TD, SCITEC 


Ngân hàng dư liệu 











Cơ sở đữ liệu được tạo ra, quản lý và khai thác bằng 
phần mềm máy tính, thường gọi là hệ quản trị cơ sở đữ liệu. 
Hệ quản trị cơ sở dữ liệu cho phếp người sử dụng có thể 
thực hiện những chức năng cơ bản sau đây trong việc quản 
lý dữ hiệu: mô tả dữ liệu, cập nhật và bảo trì dữ liệu, tìm 
kiếm dữ liệu lưu trữ 


106 





Đối tượng quản lý thông tin trong cơ sở dữ liệu rất đa 
dạng. Đó có thể là các thông tin về những bài tạp chí, sách, 
tuyển tập, luận án tiến sỹ, sáng chế, tiêu chuẩn, hồ sơ cá 
nhân, hồ sơ công ty, số liệu thống kê, công thức hoá học, 
cấu tạo các chất, v.v... 

Phán loại cơ sở dữ liệu 

Có nhiều cách phân loại cơ sở dữ liệu khác nhau phụ 
thuộc vào tiêu chí phân loại được chọn. Trong hoạt động 
thông tin-thư viện người ta có thể phân loại cơ sở đữ liệu 
theo một số dấu hiệu đặc trưng sau: 

- Theo tính chất dữ liệu 

Dựa vào tính chất dữ liệu, các cơ sở dữ liệu có thể chia 
thành 2 nhóm: 

+ Cơ sở dữ liệu tư liệu: dữ liệu trong các cơ sở dữ liệu đó 
là tin tức về bản thân tài liệu. Cơ sở dữ liệu tư liệu có thể 
chia thành: 

e Cơ sở dữ liệu thư mục: chứa các thông tin thư mục 

e Cơ sở dữ liệu toàn văn 

e Cơ sở dữ liệu dữ kiện 

CSDL thư mục chứa các thông tin mô tả thư mục để 
nhận đạng về tài liệu, chỉ dẫn cho người dùng tin về nguồn 
chứa nội đung đầy đủ của tài liệu, giúp họ có khả năng lựa 
chọn nhanh chóng tài liệu cho các mục đích khác nhau 
trong cuộc sống hàng ngày. 

Thông thường CSDL thư mục sẽ đưa thêm thông tin như 
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từ khóa, chủ đề, chỉ số phân loại và trong nhiều trường hợp 
có thêm tóm tắt hoặc chú thích. 

CSDL toàn văn chứa không chỉ chứa thông báo về tài 
liệu mà chứa toàn bộ văn bản, nội dung đầy đủ của tài liệu. 

Cơ sở dữ liệu đữ kiện chứa các thông tin đạng số liệu, 
dữ kiện cụ thể, các tính chất hoặc phương pháp, quy trình,... 

- Theo phạm vi bao quát của đề tài: 

Theo phạm vi báo quát đề tài có thể chia cơ sở dữ liệu 
thành: 

e Cơ sở dữ liệu đa ngành: nội dung của dữ liệu chứa 
trong cơ sở đữ liệu thuộc nhiều ngành khoa học (ví dụ: cơ 
sở dữ liệu Pascal (Pháp); cơ sở dữ liệu sách (Thư viện Quốc 
gia). 

e Cơ sở dữ liệu chuyên ngành ngành: nội dung của các 
dữ liệu thuộc vệ một ngành cụ thể (Cơ sở dữ liệu Agrindex 
(FAO), Cơ sở dữ liệu đầu khí. (Trung tâm thông tin dầu khí 
Việt Nam); Cơ sở dữ liệu theo chủ đề: nội dung của các dữ 
liệu phản ánh theo một chủ đề xác định; Cơ sở dữ liệu về 
đân số (Trung tâm thông tin tổng cục thống kê); Cơ sở dữ 
liệu tuyển sinh (bộ giáo dục và đào tạo). 

- Theo loại hình tài liệu. 

Một số cơ sở dữ liệu này định hướng vào một loại hình 
tự liệu cụ thể và thường có nội dung đa ngành. 

e Cơ sở dữ liệu về sách 

® Cơ sở dữ liệu tạp chí 
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+ Cơ sở dữ liệu báo cáo 

+ Cơ sở đữ liệu sáng chế 

+ Cơ sở dữ liệu tiêu chuẩn.... 

Ví dụ về một số cơ sở dữ liệu theo loại hình tài liệu ở 
Việt Nam: 

Cơ sở đữ liệu sách (Thư viện Quốc gia Việt Nam} 

Cơ sở đữ liệu báo (Thư viện Quốc gia Việt Nam) 

Cơ sở dữ liệu LA (Thư viện Quốc gia Việt Nam) 

Cơ sở đữ liệu KQNC chuyên về báo cáo kết quá nghiên 
cứu (Trung tâm Thông tin Tư liệu KHCN Quốc gia 

Trong hoạt động Tìm tin trực tuyến, có một số tác giả, 
dựa tính chất của dữ liệu, chia cơ sở dữ liệu ở các ngân 
hàng dữ liệu thành 2 nhóm lớn: 

- Cơ sở dữ liệu tra cứu (Reƒference Databases) 

- Cơ sở dữ liệu gốc (Sowrce Databases). 

Cơ sở dữ liêu tra cứu là những cơ sở dữ liệu chứa các 
mẫu tìm đại diện cho nguồn tin cấp một. Các cơ sở dữ liệu 
tra cứu có mục tiêu chỉ ra nguồn chứa thông tin mà không 
chứa nội dung đầy đủ của nguồn tin cấp một. Cơ sở đữ liệu 
tra cứu có thể được chia thành hai nhóm cơ sở đữ liệu: 

. Cơ sở dữ liệu thư mục (Bibliographic Databases) 

- Cơ sở dữ liệu chỉ dẫn (Referal Databases) 

Cơ sở đữ liệu chỉ dẫn là nhóm cơ sở dữ liệu chỉ dẫn đến 
nguồn tin không phải tài liệu in (non-printed information 
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sources) mà là những nguồn tin đồng nhất hơn như về con 
người, cơ quan/tổ chức, doanh nghiệp, đề tài nghiên cứu,.... 
Các cơ sở dữ liệu chỉ dân là danh bạ tin học hoá 
(directories), cho phép tìm kiếm tên và/hoặc địa chỉ của một 
cá nhân hoặc một tổ chức. Cơ sở dữ liệu chỉ dẫn có thể có 
chứa những trường dữ liệu số (đữ kiện). Mặc dù có thể tìm 
kiếm theo chủ đề, tìm kiếm theo tên là một trong những yêu 
cầu cần có của các cơ sở đữ liệu thuộc lớp này. 

Cơ sở dữ liêu gốc là những cơ sở đữ liệu chứa thông tin 
cấp một (dữ liệu gốc) hoặc những dữ liệu được rút ra từ 
nguồn tin mà khi có chúng, người dùng tin không cần phải 
tham khảo lại nguồn chứa đữ liệu. 

Các biểu ghi trong những cơ sở đữ liệu này không chỉ 
dẫn người sử dụng tới những cuốn sách hay những bài báo 
mà cung cấp cho họ tức thì những thông tin đầy đủ. 

Các cơ sở dữ liệu gốc có thể chia thành các nhóm: 

- Cơ sở dữ liệu Số (Numeric đatabases) 

- Cơ sở dữ liệu văn bản-số (Texi-Numeric databases) 

- Cơ sở dữ liệu tính chất (Properties Databases} 

- Cơ sở dữ liệu toàn văn (Fulltext databases) 

Cơ sở dữ liệu số (Numeric databases), bao gồm thông 
tin là các số liệu được trình bày đưới đạng bảng hoặc các 
chuỗi số liệu theo thời gian (time series). Ví dụ đó là những 
số liệu về dân số, số liệu thống kê qua một giai đoạn, về sản 
xuất, nhập khẩu, xuất khẩu, về thị trường chứng khoán... 
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Cơ sở dữ liệu văn bản - số (Text-NưHmeric đatabases) là 
những cơ sở dữ liệu chứa một tổ hợp văn bản và thông tin 
đữ kiện. Nhiều cơ sở dữ liệu cung cấp thông tin về công ty 
là thuộc loại này. Chúng cung cấp thông tin mô tả công ty. 
đông thời có chứa các đữ kiện về tình hình kinh đoanh của 
công ty (như doanh thu, lợi nhuận. vốn,....). 

Các cơ sở dữ liệu tính chất (Properties Databases) chứa 
thông tin về các tính chất riêng về vật lý, hóa học và cơ học 
của các dung môi và các hợp chất, ví dụ như cơ sở dữ liệu 
Heibron (từ điển về các hợp chất vô cơ và những từ điển 
khác, sách tra cứu về hóa vô cơ của Beilstein, Martindale 
Extra Pharmacopocia, Bách khoa thư về công nghệ hóa học 
Kir-Othmer , và hệ thống tìm tin cấu trúc hóa học ĐARC. 

Cơ sở dữ liệu cung cấp cho cán bộ quản lý, các kỹ sư, 
cán bộ kỹ thuật và cơ sở sản xuất những thông tin cụ thể, 
đảm bảo độ tin cậy, giúp họ trong xuất nghiên cứu, kinh 
doanh có hiệu quả nhất. 

2.2.3.4. Ngân hàng dữ liệu 

Ngân hàng đữ liệu là một khái niệm tương đối. Ngân 
hàng đữ liệu có thể được định nghiã là "một hệ thống thông 
tin tự động hoá, khai thác trực tiếp, được cấu trúc thành cơ 
xở dữ liệu bao quái một lĩnh vực nào đó của trì thức ”. 

Ngân hàng dữ liệu có các thành phần sau: 

s - Một tập hợp các cơ sở dữ liệu khác nhau, 
trong đó có thể gồm các cơ sở dữ liệu do 
nhân hàng tự xây dựng lấy hoặc bổ sung 
từ các cơ quan/tổ chức bên ngoài. 
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" _ Tổ hợp các phương tiện xây dựng, bảo trì 
và khai thác cơ sở dữ liệu, bao gồm: 

- máy tính điện tử và các thiết bị ngoại vị; 

- các thiết bị truyền và nhận dữ liệu từ xa; 

- các thiết bị sao chụp; 

- các phần mềm quản trị các cơ sở đữ liệu, 

- các phần mềm giao tiếp giữa người và máy, 

- các thủ tục và phương pháp truyền và truy cập thông tin 

® Nhân lực làm việc với hệ thống: các nhân viên quản 
trị, vận hành và khai thác cơ sở dữ liệu,,... 

Ngân hàng dữ liệu có thể có hàng trăm cơ sở dữ liệu, 
phong phú về diện bao quát để tài, vẻ loại hình dữ liệu, 
phục vụ được các loại khách hàng với nhiều yêu cầu đa 
dạng khác nhau. 

Trong kinh doanh thông tin, người ta quan niệm các cơ 
quan cung cấp dịch vụ trực tuyến tới nhiều cơ sở dữ liệu là 
ngân hàng dữ liệu. Đó là các tổ chức bán dịch vụ truy cập 
trực tuyến. Một ngân hàng dữ liệu có thể được gọi là nhà 
bán hàng trực tuyến (vendor), là một tổ chức cung cấp cho 
khách hàng thông tin hoặc cho các chuyên gia thông tin 
giúp khách hàng truy cập trực tuyến tới các cơ sở dữ liệu 
dưới dạng máy có thể đọc được. Các ngân hàng dữ liệu có 
thể thu thập cơ sở đữ liệu từ các cơ quan sản xuất cơ sở dữ 
liệu, hoặc trong một số trường hợp, tự sản xuất ra các cơ sở 
dữ liệu mà ngân hàng đó tin rằng sẽ được khách hàng sử 
dụng. 
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Ngân hàng dữ liệu có các hệ thống phân mẻm cho phép 
tìm tin trong những cơ sở dữ liệu thuộc ngân hàng đữ liệu. 
Ngân hàng này cũng cho thuê hoặc bán và bảo trì các máy 
tính lớn và các thiết bị phụ trợ, viết tài liệu mô tả và hướng 
dẫn khai thác các cơ sở dữ liệu của họ. 

Hầu hết các ngân hàng dữ liệu là các tổ chức thương 
mại. Tất cả đều thực hiện các dịch vụ tìm kiếm thông tin. 
Thông thường giá cả truy cập thường được tính theo thời 
gian kết nối từ máy của người tìm thông tin tới máy chủ và 
khối lượng thông tin khai thác được. 

Ví dụ: Các dịch vụ của DIALOG, STN International 
đêu tính chỉ phí khai thác gồm 2 phần: 

- Thời gian truy cập hệ thống để khai thác tài nguyên 
thông tin và dịch vụ kỹ thuật của Hệ thống 

- Chỉ phí dựa trên số lượng biểu ghi tìm được, được xem 
và tẢi về. 

Số lượng các ngân hàng dữ liệu trên thế giới tăng lên 
nhanh chóng. Cuadra (1978) xác định được năm 1977 thế 
giới có 15 ngân hàng dữ liệu tầm cỡ quốc tế, trong đó có 
BRS, DIALOG, Mead Corporation, OCLC và SDC. Đến 
năm 1991 thế giới đã có 731 ngân hàng dữ liệu; trong số đó 
một phần đáng kể là các hãng cung cấp truy cẬp trực tuyến 
tới nguồn các cơ sở dữ liệu. 

Tuy nhiên cũng có các tổ chức không kinh doanh kiếm 
lời có nhiều cơ sở dữ liệu và cho phép truy cập cơ sở dữ liệu 
là các ngân hàng dữ liệu. ` 
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Với sự phát triển của Internet, công nghệ thông tin, viễn 
thông, đặc biệt là xuất bản điện tử, ngày càng xuất hiện 
nhiều nhà xuất bản cung cấp khả năng truy cập đến các tạp 
chí do họ xuất bản dưới dạng điện tử. Xuất hiện một loại 
hình tổ chức dịch vụ mới gọ! là "các tổ hợp thông tin" 
(tiếng Anh là Aggregators). Tổ hợp thông tin là một tổ chức 
thu thập, tổ chức và cung cấp dịch vụ truy cập đến tạp chí 
điện tử do họ phát hành hoặc mua trên mạng Internet. Các 
tổ hợp này cung cấp cả khả năng truy cập thông tin thư mục 
thông qua các cơ sở đữ liệu. Một số tổ hợp tin lớn như 
cienceDirect do Nhà xuất bản Elservier xây dựng hoặc 
EBSCOHost ở Hoa Kỳ cung cấp khả năng truy cập tập 
trung đến hàng chục nghìn tạp chí điện tử toàn văn. 

n 2.3 Lánh tìm 

Lệnh tìm là nội dụng yêu cầu thông tin được diễn đạt 
bằng những thuật ngữ của ngôn ngữ tìm tin. Như đã nghiên 
cứu ở trên, ngôn ngữ tìm tin có thể là: Chỉ số phân loại, đề 
mục chủ đề hoặc từ (cụm từ) được sử dụng làm từ khoá, từ 
chuẩn như: thuật ngữ khoa học, địa danh, tên nhân vật, tên 
niên hiệu chỉ thời gian,... có hoặc không có các quan hệ 
được thiết lập giữa chúng với nhau (sử dụng các toán tử 
logic OR, AND, NOT). 

Khi lập lệnh tìm cần xem xét kỹ, hệ thống sử dụng loại 
ngôn ngữ tìm tin nào để mô tả nội dung tài liệu, trên cơ sở 
đó lệnh tìm cũng được thể hiện bằng ngôn ngữ đó. Ví dụ: 
Thư viện đó sử dụng bảng phân loại nào? UDC, DDC hay 
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BBK; Bảng từ khoá của TVQG hay từ điển từ khoá khoa 
học - công nghệ của Trung tâm Thông tin KH&CN Quốc 
gia?. Trong quá trình hoạt động các thư viên, cơ quan thông 
tin sử dụng song song nhiều loại ngôn ngữ tìm tin khác 
nhau để mô tả nội dung tài liệu, tổ chức các hình thức lưu 
trữ thông tin đa dạng và giúp cho việc tra cứu thông tin đầy 
đủ, nhanh chóng, thuận tiện. 

Nếu sử dụng ngôn ngữ tìm tin bằng từ khoá để tra cứu tự 
động hoá thì cần phải xây dựng phương trình tìm. Phương 
trình tìm gồm có từ khóa kết hợp với các toán tử tìm. Việc 
áp dụng cú pháp của ngôn ngữ tìm tin trong việc xây dựng 
lệnh tìm, biểu thức tim trong tìm tin tự động hoá được trình 
bày chỉ tiết tại Chương IV và V. 

q 2.4. Con người 

Đó là những người có tác động trực tiếp tới hệ thống, 
gồm: người tìm tin và người dùng tin - những người có liên 
quan trong hệ thống. 

Người tìm tin/ Cố vấn bạn đọc: 

Tra cứu là công việc trọng tâm của tất cả các thư viện và 
cơ quan thông tin. Đa phần người dùng tin đến thư viện với 
mục đích rõ ràng và với nhu cầu tin xác định, họ biết mình 
cần thông tin gì? phải tra cứu ở đâu? phương pháp tra cứu 
như thế nào?.. Tuy nhiên cũng không ít người dùng tin 
không biết sẽ bắt đầu từ đâu. Như vậy là họ sẽ phải cần tới 
sự giúp đỡ của cán bộ thư viện - người fìm tin. Người tìm 
tin có thể là thủ thư nói riêng hoặc cán bộ thư viện nói 
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chung. Người tìm tin có thể trực tiếp trả lời câu hỏi cho 
người dùng tin hoặc giúp họ tra cứu thông tin cần thiết. 
Người tìm tin giúp người dùng tin nắm được và sử dụng 
nguồn lực thông tin thư viện. Để giúp người dùng tin lựa 
chọn thông tin phù hợp với nhu cầu của họ, do đó người tìm 
tin cần: 

Kỹ năng chung: 

- Có kiến thức hiểu biết chung tốt, 

- Có khả năng phán đoán và phân tích vấn đề, 

- Lịch thiệp, 

~ Thân mật, 

Kỹ năng giao tiếp: 

- Có kỹ năng nghe và đặt câu hỏi, 

- Có khả năng chỉ dẫn, giải thích vấn đẻ, 

- Có khả năng giúp người dùng tin không phân biệt lứa 
tuổi, tính cách, sở thích khác nhau của họ. 

Kỹ năng nghiệp vụ thông tin thư viện: 

- Nắm vững nguồn tỉn/ vốn tài liệu, am hiểu nguồn tin 

CÓ iT0ng cơ quan: nguồn tin cấp một, nguồn tin cấp hai, ba 
và những nguồn tin ở ngoaì, đặc biệt là nguồn tin trên mạng 
và những đặc thù riêng của kho tài liệu tra cứu, 

- Có hiểu biết nghiệp vụ vẻ thông tin - thự viện học: 
chính sách bổ sung và những quy tắc, yêu cầu, quy trình 
hoạt động của cơ quan thông tin thư viện và kiến thức liên 
quan tới lĩnh vực thông tin cần tra cứu 
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- Có kỹ năng tra cứu thành thục, nắm được chiến lược 
tìm tin, cách trình bày và biết sử dụng những phương tiện 
kỹ thuật nhằm đáp ứng yêu cầu thông tin, 

- Có khả năng quyết định những yêu cầu tin nào có thể 
giúp NDT tham khảo hoặc tra cứu, những yêu cầu cần chỉ 
dẫn họ tới thư viện hoặc cơ quan thông tin khác phù hợp, 

- Có những hiểu biết về nguyên tắc và các dịch vụ khách 
hàng, 

- Có sự ham thích. say sưa với công tấc tra cứu. 

Đề đáp ứng với những yêu cầu trên, người tìm tin không 
bao giờ thoả mãn với kiến thức mình có. Nếu không thể trả 
lời được câu hỏi của người dùng tin, cản hướng dẫn họ tới 
những người, những nơi có thể giúp họ tra cứu thông tín cần 
thiết. Cần phải thường xuyên cập nhật thông tín cả những 
vấn đề về nghiệp vụ cũng như những vấn đề chuyên môn 
sâu (nếu làm việc ở các cơ quan thông tín - thư viện chuyên 
ngành) và những vấn đề mang tính thời sự - chính trị được 
đăng tải trên các phương tiện thông tin đại chúng như: báo, 
tạp chí, đài truyền hình, đài phát thanh Trung ương và địa 
phương. Trong thực tế không ít trường. hợp những yêu cầu 
tin xuất phát từ đó. 

Người dùng tin 

Ngươì dùng tin - là yếu tố cơ bản của mọi hệ thống 
thông tin. Người dùng tin là đối tượng phục vụ của công tác 
thông tin - thư viện, họ vừa là khách hàng của các dịch vụ 
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thông tin, đồng thời họ cũng có thể là người sản sinh ra 
thông tin mới. 

Người dùng tin giữ vai trò quan trọng trong các hệ thống 
thông tin. Họ như là yếu tố tương tác hai chiều với các đơn 
vị thông tỉn, là cơ sở để định hướng các hoạt động của một 
đơn vị thông tin: họ tham gia vào hầu hết các công đoạn của 
dây chuyển hoạt động thông tin thư viện. Họ biết những 
nguồn thông tin và có thể thông báo và đánh glá các nguồn 
thông tin đó; có khả năng giúp đỡ trong việc lựa chọn, bổ 
sung (chính sách bổ sung phụ thuộc vào nhu cầu tin của 
người dùng tin); có thể tham gia xây dựng ngôn ngữ tìm tin, 
xác định cấu trúc các bộ phiếu; vào công đoạn xử lí thông 
tin; hình thành chiến lược tra cứu và đánh giá kết quả tìm 
tin. 

Tóm lại để đáp ứng như câu thông tin trong kỷ nguyên 
mới với chủ trương phát huy nội lực trong phát triển kinh tế 
xã hội, việc tìm tin và cung cấp thông tin từ các nguồn tin 
trong nước, đặc biệt là nguồn tin "xám" có ý nghĩa quan 
trọng vì nó giúp cho cán bộ khoa học nghiên cứu không bị 
trùng lặp, mặt khác vấn đề tra cứu thông tin mới trên các 
mạng, đặc biệt trên mạng Internet phục vụ cho công tác 
nghiên cứu- triển khai, phát triển kinh tế - xã hội, hội nhập 
kinh tế quốc tế giữ vai trò quan trọng trong hoạt động thông 
tin thư viện. 

Trên cơ sở nguồn thông tin hiện có, tổ chức tốt bộ máy 
tra cứu đa dạng, phong phú, linh hoạt với các trang, thiết bị 
mới, bộ tra cứu thông tin của cơ quan thông tin- thư viện sẽ 
đáp ứng nhu cầu tin của công cuộc đổi mới. 
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CHƯƠNG 2 
CHIẾN LƯỢC TRA CỨU THÔNG TIN 


| Trong dây chuyển hoạt động thông tin tư liệu, tra cứu 
thông tin là công đoạn quan trọng. Để thực hiện tra cứu có 
hiệu quả, đáp ứng yêu cầu phong phú, đa dạng của người 
dùng tin cần có chiến lược tra cứu khoa học, logic, có bộ 
máy tra cứu đầy đủ và người tìm tin có kinh nghiệm, linh 
hoạt. 

Đề tiến hành tra cứu thông tin cần xác định các yếu tố 
của chiến lược tìm tin. Các yếu tố đó gồm: 

Lệnh tìm: 

Lệnh tìm là nội dung yêu cầu thông tin được diễn đạt 
bằng những thuật ngữ của ngôn ngữ tìm tin. Lệnh tìm có 
thể được thể hiện bằng: 

- Các chỉ số phân loại. 

Ví dụ: - Tra cứu theo Bảng phân loại dùng cho các thư 
viện tỉnh, thành phố (2002): 

3. Các khoa học xã hội - Chính trị 
55. Địa lý tự nhiên. Vật lý địa cầu. Địa chất học 
6C7.7 Các chất sơn và các chất phẩm màu 

- Các đề mục chủ đẻ: 
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Thực phẩm 
Vệ sinh môi trường 
Thơ trữ tình 

- Từ khoá, từ chuẩn: 

Thuật ngữ khoa học: toán học sác xuất. truyền hình, đè 
hiệu,... l 

Tên riêng: (bao gồm tên người, tên địa danh, tèn niên 
hiệu chỉ thời gian) 

+ Tên người: Nguyên Binh Khiêm, Đinh Gia Khánh, 
Phan Minh,... 

+ Tên địa lý: Tây Bắc, Hà nam, Cù lao chàm.... 

+ Tên niên hiệu chỉ thời gian: Thế kỷ XX, Cách Mạng 
Tháng Tám, Kỷ nguyên thông tin,...Có (hay không có) các 
quan hệ được thiết lập giữa chúng với nhau. 

Mẫu tìm: 

Mẫu tìm là nội dung, ý nghĩa của tài liệu được điễn đạt 
bằng những ngôn ngữ tìm tin (Đề mục chủ đẻ, kí hiệu phân 
loại, từ khoá). Mẫu tìm chỉ thể hiện nội dung, ý nghĩa cơ 
bản của tài liêu mà không phải toàn bộ thông tin chứa 
trong tài liệu đó. Nội dung này phù hợp với một tài liệu nào 
đó và dùng nó trong tập hợp nhiều các tài liệu khác. 

Ví dụ: 

- Khung phân loại: 

341. Hoá lí. Lí hoá. Hoá học keo. (Theo bảng phân loại 
dùng cho các thư viện khoa học tổng hợp). Như vậy các tài 
liệu có nội dung phản ánh về hoá lí, lí hoá, hoá học keo đều 


120 





được định kí hiệu là 54 trong mục lục phân loại của hệ 
thống mục lục. 

- Đề mục chủ đề: Đối ngoại: các tài liệu có nội dung 
phản ánh vẻ đối ngoại đều có chủ để "đối ngoại” và tập 
trung ở Mục lục chủ đề của Hệ thống mục lục. 

- Từ khoá: Vết thương: Các tài liệu có nội dung phản 
ánh về vết thương đều được định từ khoá " vết thương ” và 
tập trung trong ấn phẩm thông tin hoặc cơ sở dữ liệu. 

Mảng tìm: 

Mảng tìm là những hình thức lưu trữ thông tin, phản ánh _ 
nguồn lực của cơ quan thông tin thư viện. Mảng tìm chính 
là các thành phần của bộ máy tra cứu. 

- Bộ máy tra cứu truyền thống: Hệ thống mục lục phiếu, 
các hộp phiếu tra cứu, tài liệu tra cứu dạng giấy,.. 

- Bộ máy tra cứu bán tự động: Phiếu lỗ mép, phiếu lỗ 
SOI... 

- Bộ máy tra cứu tự động hoá: Mạng thông tin, ngân 
hàng dữ liệu, các cơ sở dữ liệu thư mục, dữ kiện, chỉ dẫn, 
mục lục truy nhập công cộng trực tuyến (OPAC), Tài liệu 
tra cứu điện tử,.. 

Người tìm tin. 

Con người là yếu tế không thể thiếu được trong hoạt 
động thông tin tư liệu nói chung cũng như quá trình tìm tin 
nói riêng. Đó chính là những người trực tiếp tiến hành tra 
cứu tài liệu / thông tin cần thiết. Họ có thể là thủ thư, hoặc 
cán bộ thư viện và cũng có thể là người dùng tin. Trong quá 
trình tra cứu, nếu lệnh tìm và mẫu tìm trùng hợp nhau và 
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thông tin có trong mảng tìm, có nghĩa là quá trình tra cứu 
tin đạt kết quả, yêu cầu của người dùng tin được đáp ứng. 
Để tiến hành tra cứu cân tiến hành các bước logic và hợp lý. 


1. CÁC BƯỚC CỦA QUÁ TRÌNH TRA CỨU/TÌM TIN 


Các bước của quá trình tra cứu có thể được trình bày như 
trong hình 2. 


Tìm hiểu yêu cầu và phân tích vấn đề 





Thể hiện yêu cầu bằng ngôn ngữ tìm tin 





Xác định nghồn tra cứu 


Xác định công cụ tra cứu 


Thực hiện tra cứu 


Đánh giá kết quả của chiến lược tìm 


Biên tập và trình bày thông tin 


Đánh giá tính phù hợp với yêu cầu tin 
Hình 2. Sơ đồ quá trình từm tin 


122 





a 1.I. Tìm hiểu yêu cầu tin và phân tích vấn đề 

Cùng với sự phát triển mạnh mẽ của khoa học công nghệ 
các nhu cầu xã hội ngày càng không ngừng gia tăng. Các 
nhu cầu hiện nay không chỉ bó hẹp trong phạm vi về ãn, 
mặc, ở, đi lại,.. mà còn có nhiều nhu câu khác trong đó có 
- nhu cầu về thông tin / tư liệu. 

Nhu cầu của người dùng tin là cơ sở quan trọng để tiến 
hành các hoạt động thông tin. Nhu cầu tin xuất phát từ nhu 
cầu nhận thức: nhu cầu muốn được hiểu biết và khám phá 
về các sự vật, hiện tượng, quy luật,.. Một khi con người có 
nhu cầu nhận thức, tất yếu họ sẽ có nhu cầu thông tin ổn 
định. 

Nhu cầu tin là tính chất của một đối tượng cá nhân, tập 
thể hoặc một hệ thống nào đó thể hiện sự cân thiết nhận 
thông tin phù hợp với hành vi hay công việc mà đối tượng 
đó đang thực hiện. Nhu cầu tin vừa mang tính chủ quan và 
vừa mang tính khách quan. 

Nhu cầu tin mang tính chủ quan vì nó gắn với người 
dùng tin nhất định. Nhu cẩu tin phụ thuộc vào kiến thức, 
trình độ của từng người dùng tin, và cũng mang tính khách 
quan vì nó phát sinh từ hoạt động thực tiên của con người 
và xã hội mà họ sinh sống. 

Nhu cầu tin có nhiều loại, trong quá trình tìm hiểu nhu 
cầu tin của người dùng tin, cần phân biệt: 

Như cầu tin tuyệt đối: đó là sự cân thiết nhận thông tin 
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một cách đầy đủ, trực tiếp, chính xác, kịp thời để giải quyết 
công việc, 

Như câu trà thực tế: là sự cần thiết, đòi hỏi của người 
dùng tín về thông tin và được thoả mãn bằng những thông 
tin hiện có trong cơ quan thông tin thư viên đó. Nhu cầu tin 
thường tồn tại trong thời gian tương đối dài 

Yêu cầu trn là sự thể hiện một khía cạnh của nhu cầu tin 
được diễn đạt bằng ngôn ngữ tự nhiên. 

Người dùng tin đến cơ quan thông tin thư viện và thể 
hiện nhu cầu tin bằng những yêu cầu tin cụ thể. Để thể hiện 
trọn vẹn một nhu cầu tin, NDT phải thể hiện hàng loạt các 
yêu cầu tin, đồng thời có sự liên hệ, trao đổi hiệu chỉnh 
thường xuyên giữa cơ quan thông tin thư viện và người 
dùng tin. : 

Yêu cầu tin được cụ thể hoá bằng các câu hỏi. Để trả lời 
được câu hỏi một cách đầy đủ, cán bộ tra cứu cần thiết phải 
phân tích nhằm: 

_~ Xác định câu hỏi để làm rõ nội đung của vấn đề: 

+ Câu hỏi đó thuộc lĩnh vực nào? 

Thông thường, các câu hỏi của người dùng tin đưa ra 
thuộc những lĩnh vực, vấn đề quen thuộc, thuộc diện phục 
vụ của cơ quan thông tin - thư viện, nếu gặp những vấn đề 
mới, để nám vấn đề, có thể tham khảo trong các từ điển 
chuyên nghành, từ điển thuật ngữ, các loại bách khoa thư có 
trong thư viện hoặc từ điển từ chuẩn. 
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+ Chọn các thuật ngữ, lĩnh vực khoa học liên quan tới 
câu hỏi. Những thuật ngữ này cần chọn trong bảng từ khoá, 
từ chuẩn, bảng để mục chủ đẻ, hoặc bảng phân loại mà cơ 
quan thông tin - thư viện dùng để định từ khoá, định chủ đẻ. 
phân loại tài liệu, giúp cho việc tìm tin nhanh chóng, chính 
xác và không bị mất tin. 


PHIẾU YÊU CẦU TIN 
Họ và tên: 
Chức vụ:. 
Trình độ: n Tiến sĩ sỹ 1 Thạc sỹ n Đại học: n Sinh viên 
Địa chỉ hiên lạc:.. lá hệt AI Phá sat 2t CSE lš hà Thế so lò 8 


Điện Thoại. 
Yêu cầu tin: 


Ngôn ngữ: [lTátcả [].Anh [ Nga L] Pháp 
ắ Độ hồi cố: từ năm 


Gợi ý từ khoá: 

Những bài báo đã biết: 
lP 
lễ 

Thời gian cần kết quả: 





Hình 3. Ví dụ về biểu mẫu nhận yên cầu tìm tin 
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+ Xác định mức độ chỉ tiết/ độ rộng của vấn đề. Điều 
này phụ thuộc vào đối tượng người dùng tin: Ai sẽ sử dụng 
thông tin được cung cấp? học vấn? trình độ chuyên môn? 
trình độ ngoại ngữ? sở thích?. Họ nghiên cứu vấn đẻ nhằm 
mục đích gì? Để phục vụ cho công tác nghiên cứu, học tập, 
ứng dụng - triển khai hay nâng cao dân trí,.. 

- Xác định thời gian xuất bản của tài liệu. Người dùng 
tin cần tài liệu/thông tin xuất bản từ khi nào? Từ đó xác 
định người dùng tin cần thông tin cập nhật (hiện tại), thông 
tin hồi cố (lịch sử ) hay dự báo? 

- Xác định thời gian người dùng tin cần được cung cấp 
thông tin: Tức thời, định kỳ hay vào thời điểm nhất định 
nào đó?. 

- Xác định ngôn ngữ của tài liệu người dùng tin có khả 
năng sử dụng được: tài liệu bằng tiếng Nga, tiếng Anh, 
tiếng Trung?,... : 

- Xác định hình thức xuất bản của tài liệu: người dùng 
tin cân: Sách, báo, tạp chí, catalo công nghiệp (Mục lục 
công nghiệp), tranh ảnh, bản đồ; Dạng tài liệu (giấy, dạng 
điện tử), phim ảnh , băng hình hay đĩa nhạc?,... 

- Xác dịnh hình thức cung cấp thông tin (sản phẩm đầu 
ra): Có thể tài liệu gốc (bản sao); chương hoặc sơ đồ nào đó 
trong một / tập tài liệu cụ thể; danh mục tài liệu, tóm tắt tài 
liệu; các số liệu; biểu; bảng ; bản đồ hoặc trích lục bản đồ 
Nị 


- .}. ˆY. 
` 
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Để tra cứu được thông tin chính xác và phù hợp. cần 
thiết phải trao đổi với người dùng tin đề làm rõ các vấn để 
liên quan tới câu hỏi, có kết luận sơ bộ: vấn để đó có nằm 
trong diện bao quát đề tài của cơ quan thông tin thư viện 
mình hay không?. Nếu không thuộc điện bao quát đề tài 
cần chỉ cho người dùng tin đến nơi khác phù hợp với yêu 
cầu của họ. Còn thuộc diện phục vụ, sẽ tiếp tục các bước 
tiếp theo nhằm lựa chọn tài liệu cho thích hợp với từng đối 
tượng cụ thể. 

Để hỗ trợ cho tìm hiểu yêu cầu tin và phân tích vấn, 
người cán bộ thực hiện tra cứu hoặc tìm tin cần sử dụng các 
phiếu yêu tin và yêu cầu người dùng tin điền chỉ tiết phiếu 
yêu cầu tin. Một ví dụ về phiếu yêu cầu tin được trình bày 
trong hình 3. 

a 1.2. Thể hiện yêu cầu bằng ngôn ngữ tìm tỉn. 

Các yêu cầu tin/câu hỏi của người dùng tin được thể 
hiện bằng ngôn ngữ tự nhiên. Tuy nhiên với ngôn ngữ đó 
không phải lúc nào chúng ta cũng tra cứu được tài liệu/ 
thông tin họ cần, đặc biệt là khi tìm tin theo nội dung. Như 
vậy để tra cứu thông tin theo nội dung cần chuyển các yếu 
tố câu hỏi sang các yếu tố ngôn ngữ tìm tin. Các yếu tố này 
có thể được thể hiện bằng một/ một số: 

- Ký hiệu phân loại (Ngôn ngữ tìm tin theo hệ thống 
đẳng cấp), 

- Chủ đề (Ngôn ngữ tìm tin theo đề mục chủ đề), 

- Biểu thức tìm (Ngôn ngữ tìm tin theo từ khoá + toán tử 
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tm) dưới dạng tương thích với ngôn ngữ tư liệu được sử 
dụng trong quá trình xử lý nội dung của cơ quan thông tin 
thư viện và nơi quá trình tra cứu được tiến hành. 

4 1.3. Xác định nguồn tra cứu ` 

Nguồn tra cứu trong các thư viện và cơ quan thông tin rất 
đa dạng và phong phú. Dựa vào câu hỏi để xác định: 

- Thông tin cần tra cứu thường có ở đâu? Có trong cơ 
quan thông tin - thư viện của mình?, cơ quan lưu trữ, cơ 
quan thông tấn báo chí hay các phòng tư liệu của cơ quan 
khác? 

- Hình thức và loại hình xuất bản nào phù hợp? Báo, tạp 
chí, sách, luận án, tài liệu chuyên dạng;...Dưới dạng giấy, vi 
hình. vi phiếu, tài liệu điện tử? 

Hiện nay thực hiện việc tra cứu không chỉ giới hạn ở 
trong một thư viện cụ thể nào đó, mà không Ít trường hợp 
phải khai thác tài liệu/ thông tin từ bên ngoài qua các mạng 
thông tin trong nước và quốc tế để có được những thông tin 
đáp ứng yêu cầu. 

n Ï.4. Lựa chọn công cụ tra cứu. 

Ở cơ quan thông tin thư viện công cụ tra cứu rất phong 
phú, đa dạng, phản ánh được nhiều khía cạnh về nội dung, 
hình thức, ngôn ngữ cũng như bao quát các loại hình của tài 
liệu. Công cụ tra cứu trong cơ quan thông tin thư viện 
thường được tổ chức thành: 

- Công cụ tra cứu truyền thống: Hệ thống mục lục 
dạng phiếu, các bộ phiếu tra cứu, kho tài liệu tra cứu,... 
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- Công cụ tra cứu tự động hoá: ngân hàng dữ liệu, cơ sở 
dữ liệu, OPAC, tài liệu tra cứu điện tử..... 

Với các yêu cầu tin cụ thể đã xác định, cần lựa chọn nên 
sử dụng công cụ tra cứu nào phù hợp với nguồn thông tin 
cấp một. 

Để tra cứu nhanh chóng, đầy đủ cần xác định các nguồn 
tra cứu chỉ dẫn tới các nguồn tin. Các nguồn tin đó gồm: 
Các bảng tra, bảng chỉ dẫn ở các bộ Bách khoa thư, từ điển 
bách khoa, ấn phẩm thông tin,... 

Đối với những vấn để có nội dung chuyên ngành hẹp, 
người dùng tin cần thông tin một cách chỉ tiết hoặc thông 
tin mới trong khi Người tìm tin chưa có điều kiện cập nhật 
hoặc không thật chuyên sâu, họ có thể tiếp xúc, gặp gỡ trực 
tiếp với các chuyên gia/ cộng tác viên của thư viện trong 
lĩnh vực chuyên môn đó, vì các cộng tác viên là những 
người rất am hiểu nguồn lực thông tin của thư viện, thông 
thạo phương pháp tra cứu và là chuyên gia trong nh vực 
đó, để họ giúp đỡ làm rõ vấn để hoặc gợi ý nên tra cứu 
trong cơ sở dữ liệu, tài liệu tra cứu nào... mà cán bộ tra cứu 
chưa biết hay không có tại thư viện. 

u 1.5. Thực hiện tra cứu 

Để thực hiện tra cứu cần 2 yếu tố: khoá tìm và khoá truy 
nhập 

- Khoá tìm: là yếu tố phản ánh những đặc tính khác nhau 
của đối tượng, được sử dụng trong quá trình tra cứu tin và 
lựa chọn thông tin. Người dùng tin biểu thị chúng trong yêu 
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cầu của mình khi phản ánh các thuộc tính vẻ nội dung và 
hình thức của thông tín. 

- Khoá truy nhập: là các thuật ngữ phản ánh vẻ chủ đề, 
môn loại của đối tượng: ngành, chuyên ngành khoa học - 
công nghệ, loại đơn vị sản xuất kinh doanh, loại cơ quan 
nghiên cứu, triển khai,...; Các thông tin về tác giả; loại đối 
tượng thông tin: tài liệu in, tài liệu điện tử,..: về vùng địa lý: 
Tên châu lục, vùng, nước, tên địa danh cụ thể,.: Danh 
nhân/ Nhân vật: Những người nổi tiếng trong nước và trên 
thế giới...; khoảng thời gian có liên quan tới đối tượng mà 
yêu cầu tin hướng tới,.. 

Khi tra cứu tin cần phối hợp các khoá tìm và khoá truy 
nhập 

Khi tra cứu bằng phương pháp truyền thống (tra cứu thư 
mục) với những vấn để đơn giản, với kinh nghiệm của các 
cán bộ tra cứu tốt, nguồn tin không lớn, có phương pháp tra 
cứu cụ thể, người tìm tin có thể lựa chọn tài liệu / thông tin 
một cách nhanh chóng, chính xác, tiết kiệm được thời gian, 
công sức cho cán bộ tra cứu cũng như của người dùng tin. 
Thực hiện việc tra cứu truyền thống phải bắt đầu từ các 
bảng tra cứu- chỉ dẫn (Index), tiến hành từ vấn đẻ chung 
đến vấn đề cụ thể. Với các yêu cẩu tin đơn gian như hỏi về 
một tài liệu cụ thể quen thuộc, cán bộ tra cứu có kinh 
nghiệm nắm vững nguồn tin có trong thư viện, kho tài liệu 
không lớn, thì yêu cầu tin được đáp ứng một cách nhanh 
chóng. 


130 





Muốn có thông tin chính xác phải có tài liệu hạt nhân. 

Đối với tìm tin tự động hoá việc tra cứu được tiến hành 
thông qua các biểu thức tìm. Biểu thức tìm là sự kết hợp 
giữa các từ khoá / từ chuẩn và các toán tử tìm (OR - Mở 
rộng phương trình tìm; AND - Thu hẹp phương trình tìm; 
NOT - Phương pháp loại trừ). Trong quá trình thực hiện 
việc tra cứu, biểu thức tìm được người tìm tin điều chỉnh 
cho phù hợp nhằm đạt được kết quả như ý muốn. 

a 1.6. Phản tích kết quả của chiến lược tìm tín 

Kết quả của chiến lược tìm tin được thể hiện bằng kết 
quả dưới nhiều hình thức khác nhau (thông qua việc thực 
hiện một số chiến lược tìm và biểu thức tìm khác nhau). 
Trên cơ sở đó kiểm tra, đánh giá các kết quả tìm được và 
lựa chọn kết quả được coi là phù hợp nhất. 

Theo đánh giá chủ quan của cán bộ tra cứu có kinh 
nghiệm, nếu kết quả nhận được qua tra cứu: quá nhiều hoặc 
ngược lại, quá ít tài liệu / thông tin (số liệu, dữ kiện), cần 
thiết phải phân tích lại yêu cầu tin, lựa chọn công cụ cho sát 
thực và xác định lại nguồn tìm. 

Kết quả tìm tin được có thể dưới một / nhiều dạng thức 
sau: _ 

- Tài liệu gốc / bản sao: Sách, tạp chí, báo cáo tổng kết, 
biểu đồ, tài liệu nghe nhìn,... 

- Dữ kiện / tập hợp dữ kiện 
- Số liệu / tập hợp các số liệu,... 
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a 1.7. Hiên tập và tình bày thông tin 

Biên tập và trình bày thông tin tìm được là một bước 
quan trọng trong chiên lược tra cứu. Nó giúp cho người 
dùng tin tiếp nhận thông tin một cách thuận tiện, khoa học. 
Trong các cơ quan thông tin thư viện thông tin / tài liệu 
thường được trình bày dưới nhiều dạng: 

- Danh mục tài liệu, 

- Bản thư mục, bài / các bài tóm tất, bài tổng 
quan,..(thông tin đã được xử lý hình thức và nội dung), 

- Tệp dữ liệu,,... 

Sắp xếp: 

- Theo thứ tự chữ cái tên tác giả/ Nhân vật 

- Theo tiêu đề mô tả, 

- Theo môn ngành khoa học, 

- Theo đề mục chủ đề, 

- Theo thời gian xuất bản tài liệu, 

- Theo mức độ phức tạp của vấn đẻ... 

n 1.8. Đánh giá tính phù hợp của thông tin nhận 

được 

Khi nhận được tài liệu / thông tin từ cơ quan thông tin - 
thư viện, người dùng tin đánh giá tính chính xác, sự phù 
hợp của thông tin nhận được: 

- Chất lượng và giá trị của thông tin được cung cấp. 

Trong trường hợp thông tin không phù hợp cần phân tích 
nguyên nhân. Nguyên nhân có thể là: 
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+ Do người tra cứu không hiểu đúng câu hỏi, 

+ Do người dùng tin đưa yêu cầu thông tin không sát để 
tài - vấn đề, 

+ Do mảng tin không đáp ứng, 

+ Do trình độ của cán bộ tra cứu.... 

Trong trường hợp kết quả tra cứu không phù hợp, quá 
trình tìm tin phải quay lại từ bước 1: Tìm hiểu yêu cầu tin 
và phân tích vấn đề. 

Quá trình tra cứu tin chỉ có thể kết thúc khi người dùng 
tin đánh giá: thông tin nhận được phù hợp với yêu cầu tin 
của họ. Kết thúc quá trình tìm tin, cơ quan thông tin thông 
tin - thư viện đánh giá kết quả tìm, có dựa trên cơ sở đánh 
giá của người dùng tin. Việc đánh giá quá trình tìm tin nhằm 
2 mục đích. 

- Làm cho người dùng tin ngày càng thoả mãn yêu cầu 

- Để cải tiến và hoàn thiện hoạt động của cơ quan thông 
tin thư viện 

Tuy nhiên, đôi khi sự đánh giá của người dùng tin cũng 
có thể mang tính chủ quan, cần phân tích kỹ. 

Để phục vụ tốt người dùng tin cần: 

- Bổ sung nguồn lực thông tỉn một cách đều đặn, thông 
tin cập nhật phù hợp với chức năng, nhiệm vụ của cơ quan 
thông tin thư viện 

- Nâng cao trình độ của cán bộ thông tin về chuyên môn 
nghiệp vụ, ngoại ngữ, tin học 
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- Tầng cường cơ sở vật chất - kỹ thuật cho cơ quan thông 
tin - thư viện, đặc biệt những trang thiết bị hiện đại, đáp ứng 
nhu cầu của sự phát triển khoa học công nghệ trong nước và 
trên thế giới. 

Nếu trong quá trình phục vụ tra cứu, cơ quan thông tin 
thư viện luôn đáp ứng yêu cầu của người dùng tin, cưng cấp 
thông tin đầy đủ, nhanh chóng, chính xác và cập nhật, thì 
người dùng tin sẽ tin tưởng và đến với cơ quan nhiều hơn. 
Vai trò, uy tín cũng như hiệu quả hoạt động của cơ quan 
được tăng lên, 

Tính thích hợp của thông tin nhận được, được đánh giá ở 
4 mức độ: 

+ Cơ bản 

+ Trung bình 

+ Đáng chú ý 

+ Thừa 

Quá trình tra cứu trong thư viện có thể được tiến hành 
bằng 2 cách: Tra cứu trực tiếp và tra cứu gián tiếp 

Trong trường hợp 074 cứu trực tiếp (Direct search) người 
dùng tin trực tiếp thực hiện tất cả hoặc hầu hết các thao tác 
tìm kiếm cùng với sự hỗ trợ đơn giản của chuyên gia thông 
tin, như: việc định hướng nên tra tìm bằng các công cụ nào 
để nhận được thông tin cần thiết, cũng như góp ý cho cách 
thức thể hiện yêu cầu tin thông qua chiến lược và lập biểu 
thức tìm,... 
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Khi phép tìm không đạt được kết quả như ý muốn, cần 
phải xác định lại yêu cầu cho rõ hơn, cũng như xem xét lại 
một số giai đoạn như vạch chiến lược tìm, xây dựng biểu 
thức tìm, xác định nguồn tin cấp 2 để tiến hành việc tra tìm. 

Chất lượng của quá trình tra cứu tin phụ thuộc vào sự 
hiểu biết về nguồn thông tin, bộ máy tra cứu, sự hiểu biết 
lẫn nhau giữa người dùng tin và chuyên gia thông tin, kỹ 
năng điều chỉnh chiến lược tìm tin và biểu thức tìm để đạt 
tới kết quả, nhằm thoả mãn yêu cầu. 

Kết thúc quá trình tra cứu cơ quan thông tin thư viện có 
thể cung cấp nguồn tin cấp 1 (bản sao tài liệu gốc. hoặc xử 
lý sâu về nội dung tài liệu: bản tóm tát, bài tổng quan, lược 
dịch,.... 

Trong trường hợp ira cứu tin gián tiếp (Indirect search) 
đa số trường hợp người dùng tin thông qua chuyên gia 
thông tin để thực hiện việc tra tìm t. Chuyên gia tra cứu tin 
đóng vai trò là người trung gian giữa người dùng tin và hệ 
thống tìm tin. Họ có trách nhiệm đảm bảo sự truyền thông 
có hiệu quả giữa người dùng tin đầu cuối và hệ thống tìm 
tin. Để đạt được điều đó, chuyên gia tra cứu sẽ phải tìm 
hiểu một cách cặn kế nhu cầu tin, thông qua quá trình 
phỏng vấn và tham khảo từ người dùng tin. Lược đồ tổng 
quát của quá trình tra cứu tin gián tiếp có thể được mô tả 
như trong hình 4. 
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Đối thoại Người/hệ 


Đối thoại khách 
hàng/chuyên gia thống 
Người dùng tin Chuyên gia tìm tin 


Hình 4. Sơ đồ quá trình tra cứu tin gián tiếp 






Như đã để cập ở phần trên (các bước của quá trình tra 
cứu), người tìm tin cần thiết phải đối thoại trực tiếp với 
người dùng tin để làm rõ một số vấn đề trước khi tiến hành 
tra cứu như: : 

- Người dùng tin hiểu như thế nào về yêu cầu tin? 

- Xuất phát từ đâu người dùng tin đưa ra yêu cầu? 

- Mục dích của yêu cầu phục vụ cho việc gì? 

- Loại yêu cầu thông tin nào họ cần? 

- Loại tài liệu nào phù hợp với họ? 

~ Ngôn ngữ có khả năng sử dụng được? 

- Hình thức của thông tin được cung cấp? 

- Phạm vi chính xác về không gian, thời gian mà kết quả 
cần bao quát? 

- Thời gian mong nhận được kết quả? 

- Khi thực hiện quá trình tìm tin, chuyên gia tìm cần có 
sự hiểu biết và kỹ lưỡng chỉ tiết vẻ: 
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- Sự phân bố các nguồn tín. 

+ Các cơ quan lưu trữ tài liệu cấp1: theo loại hình tài 
liệu, hình thức xuất bản : 

Tài liệu công bố có tại: 

- Thư viện quốc gia 

- Hệ thống thư viện công cộng 

- Các thư viện chuyên ngành, đa ngành 

- Thư viện trường học.... 

Tài liệu không công bố (chưa được xuất bản: bản thảo 
khoa học, tư liệu điều tra, tư liệu dịch...) 

- Các trung tâm thông tin -tư liệu 

- Kho lưu trữ nhà nước 

- Trung tâm dịch vụ hỏi và đáp.... 

- Các trung tâm phân tích tin (Chứa các tài liệu xử lý 
phân tích tổng thuật, tài liệu tổng quan) 

- Cơ quan môi giới và dịch vụ (môi giới thương mại, môi 
giới thông tin, các cơ quan dịch vụ) 

- Hệ thống thông tin hành chính. 

- Hệ thống thông tin thống kê kế hoạch... 

Mạng thông tin: 

Cung cấp các tài liệu, số liệu nước ngoài, các thông tin 
đòi hỏi có trình độ cập nhật cao, các thông tin phục vụ tra 
cứu, trao đổi thông tin nhanh chóng.... 
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- Mạng LAN, 

- Mang WAN, 

- Mạng quốc gia (Intranet), 

- Mạng internet, 

- Các công cụ và các nguồn tra cứu thông tin (nguồn 
tìm). 

Các công cụ và các nguồn tra tìm. 

- Hệ thống mục lục. 

Mục lục chữ cái, mục lục phân loại, mục lục chủ đề.... 

- Các loại thư mục và thư mục bậc 2. 

Là cơ sở củ. noi cuốc: tìm kiếm tri thức. Người tìm tin 
có thể khai thác thông tin một cách thuận tiện, dễ đàng và 
đầy đủ. 

- Thư mục trích dẫn (Citation Index): Là loại bảng tra có 
tầm quan trọng đặc biệt nhằm phát triển thêm các tư liệu 
thích hợp với đề tài. 

+ Thư mục trích dẫn là bảng liệt kê theo vần chữ cái tên 
tác giả được trích dẫn. Trong từng đề mục (tên tác giả được 
trích) là dạng sách các tác giả trích dẫn cùng một số thông 
tin bố sung như các thông tin về nguồn (tên tập chí, số tạp 
chí, năm xuất bản của tạp chí,..) có chứa các bài viết của 
các tác giả trích dẫn. 

+ Thư mục trích dẫn nguồn (source Index): là bảng liệt 
kê theo vần chữ cái tên các tác giả trích dẫn cùng với các 
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thông tin thư mục đầy đủ của tài liệu / thông tin trích dẫn. 

+ Thư mục trích dẫn chủ đề hoán vị (Permuterm Subject 
Index) 

Là danh sách theo vần chữ cái các thuật ngữ được sự 
dụng để tạo ra các đề mục chủ đẻ, và trong mỗi thuật ngữ là 
theo danh sách theo vần chữ cái các tác giả trích dẫn có bài 
viết được phản ánh trong chỉ dẫn và đề cập tới nội dung có 
liên quan tới thuật ngữ này. 

- Danh mục: là một bảng liệt kê cho phép xác định được 
thông tin về một/ một nhóm đối tượng nào đó thuộc các 
lĩnh vực hoạt động xã hội hoặc khu vực địa lý. Đối tượng 
được phản ánh trong danh mục có thể: 

+ Cá nhân, cơ quan, đơn vị hành chính, đơn vị kinh tế, 
sản phẩm hàng hoá, nhà sản xuất... 

+ Lĩnh vực hoạt động xã hội: nghiên cứu và triển khai, 
các ngành dịch vụ, các ngành sản xuất, giáo dục và đào 
tạo.... 

+ Khu vực địa lý: Tỉnh, thành phố, I số tỉnh, thành phố 
(khu vực., quốc gia, một số quốc gia (khu vực quốc tế), toàn 
thế giới. 

- Hệ thống phiếu tra cứu đữ kiện: là tập hợp các phiếu 
chứa các thông tin dữ kiện vẻ một vấn đề cụ thể được xắp 
xếp theo một trật tự xác định. 

- Cơ sở dữ liệu: là một tập hợp các bản ghi hoặc có quan 
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hệ logich với nhau và được lưu trữ trên bộ nhớ của máy 


r 


tính. 

Trong khi tìm hiểu câu hỏi phải thận trọng, tránh câu hỏi 
bị nhiễu hoặc im lặng. Trong thực tế, có nhiều nguyên nhân 
khiến các chuyên gia thông tin không nám bát được đúng 
yêu cầu thực sự. Nguyên nhân có thể là do: 

- Người dùng tin không chỉ rõ và không muốn lộ ra mục 
đích thực sự trong câu hỏi của họ. 

Ví dụ: Có trường hợp người dùng tin đến thư viện hỏi 
những thông tin liên quan tới cây thuốc phiện (giống, đất 
trồng, chăm sóc, thu hoạch,..) 

Mục đích: muốn hỏi trồng cây thuốc như thế nào? nhưng 
việc trồng cây thuốc phiện bị cấm, do đó họ không thể nói 
rõ mục đích với những câu hỏi trực tiếp tới vấn để, mà hỏi 
từng ý liên quan vấn đề vào các thời gian khác nhau. 

- Người dùng tin không hiểu biết đầy đủ về khả năng của 
cơ quan thông tin thư viện cũng như nguồn thông tin / tư 
liệu mà họ yêu cầu. 

- Người dùng tin và cán bộ thông tin chưa hiểu nhau 
hoặc chưa có quan hệ hợp tác với nhau. 

- Người dùng tin đưa ra yêu cầu tin không chính xác, mơ 
hồ do không xác định được chủ đề: quá rộng hoặc quá hẹp, 
mức độ sử dụng thông tin nông hoặc sâu quá. 
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2. QUÁ TRÌNH TÌM TIN TỰ ĐỘNG HOÁ 

a 2.ï Các bước của quá trình tìm tin (ự động hoá 

Quá trình tìm tin tự động hoá, dù đó là quá trình có hoặc 
không có chuyên gia tìm tin trung gian cũng có thể được 
chia thành nhiều bước theo một trình tự hợp lý. Vẻ cơ bản 
quá trình tìm tin tự động hoá gần giống như các bước tra 
cứu tin cơ bản. Tuy nhiên, do đặc thù cần phải sử dụng 
những hệ thống tìn tin tự động hoá, các bước của quá trình 
tìm tin tự động hoá có thể có một số khác biệt so với tra cứu 
thông tin theo phương pháp truyền thống hoặc thủ công. 

Tìm tin tự động hoá là một quá trình truyền thông giữa 
người có nhu cầu tìm tin và hệ thống tìm tin. Quá trình tìm 
tin tư động hoá ở những loại hình tìm tin khác nhau có thể 
khác nhau. Quá trình tìm tin gián tiếp thông qua chuyên gia 
tìm tin cũng không giống với quá trình tìm tin của người 
dùng tin trực tiếp. Quá trình tìm tin trên những hệ thống cục 
bộ, CD-ROM có thể khác với quá trình tìm tin trực tuyến. 

Về cơ bản quá trình tìm tin tự động hoá có thể bao gồm 
các bước sau: 

{1). Phân tích nhu cầu tin 

(2). Lựa chọn nơi tìm tin 

(3) Xác định các khái niệm và thuật ngữ tìm 

(4). Xác định chiến lược tìm 

(5). Xây dựng biểu thức tìm 

(6). Truy cập hệ thống và thực hiện lệnh tìm 
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(7). Đánh giá sơ bộ kết quả tìm 

(8). Tiếp tục thực hiện lệnh hoặc hiệu chỉnh lệnh tìm 

Một số bước trong quá trình tìm tin tự động hoá được 
giới thiệu chỉ tiết hơn trong Chương IV (Tìm tin tự động 
hoá). 

a_2.2 Các bước của tìm tin trực tuyến 

Tìm tin trực tuyến là một dạng tìm tin tự động hoá. Do 
đặc thù là tìm tin trực tuyến thường liên quan đến các dịch 
vụ thông tin trực tuyến có tính thương mại, mọi thao tác với 
cơ sở dữ liệu đều bị tính chỉ phí (chỉ phí cho số từ khoá, chi 
phí cho câu hỏi, chỉ phí cho xem biểu ghi...) nên các bước 
tìm tin trực tuyế:: đồi hỏi được chuẩn bị hết sức kỹ càng. 

Tác giả Steplicn Harter cho rằng tra cứu trực tuyến bao 
gồm 12 bước như sau: 

{1) Nghiên cứu nhu cầu tin 

(2) Xác định mục tiêu tìm kiếm 

(3) Lựa chọn cơ sở dữ liệu/ngân hàng dữ liệu 

(4) Xác định khái niệm của yêu cầu tìm và quan hệ giữa 
chúng 

(5) Lựa chọn chiến lược tổng quát 

(6) Lựa chọn thuật ngữ và phương án thay thế/dự phòng. 

(7) Xác định các trường giới hạn trong tra tìm 

(8) Xây dựng lệnh tìm 

(9) Chuẩn bị phương án dự phòng 
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(10) Truy cập hệ thống và thực hiện theo lệnh tìm được 
lập 

(L1) Đáng giá sơ bộ kết quả tìm kiếm trung gian 

(12) Tiếp tục thực hiện lệnh hoặc hiệu chỉnh 

Việc chuẩn bị kỹ càng từng bước sẽ đảm bảo hiệu quả 
tra cứu tin cao, giảm chi phí truy cập và làm việc với cơ sở 
dữ liệu. 


3. ĐÁNH GIÁ HIỆU QUÁ TRA CỨU 

a 3.1. Tiêu chuẩn đánh giá 

Để đánh giá kết quả hoạt động tra cứu phải dựa vào: 

- Tính kịp thời: 

Tính kịp thời của thông tin được cung cấp phụ thuộc vào 
thời gian trả lời yêu cầu tin. Trong nên kinh tế thị trường, 
tính kịp thời của thông tin đóng vai trò hết sức quan trọng, 
nhiều khi đóng vai trò quyết định vì tính cạnh tranh trong 
sản xuất, thương mại và ai có thông tin người đó sẽ chiến 
thăng. 

- Giá thành (chỉ phí): 

Ở Việt Nam vấn đề giá thành nói riêng, cũng như kinh tế 
nói chung trong hoạt động của các cơ quan thông tin - thư 
viện vẫn đang là vấn đề mới, chưa có sự hướng dẫn, chỉ đạo 
thống nhất, mỗi cơ quan tuỳ theo điều kiện cụ thể, đặc thù 
riêng của mình để tính chi phí dịch vụ, tuy nhiên các cơ 
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quan thông Iin thư viện cũng đã dựa vào một số tiêu chí sau 
để tính: 

+ Công sức của cán bộ bỏ ra để tra cứu thông tin. 

+ Sử dụng hệ thống tìm tin của cơ quan thông tin thư 
viện hoặc kết nối với mạng thông tin trong nước và quốc tế. 

+ Hình thức của sản phẩm đầu ra. 

+ Khả năng cung cấp tài liệu gốc/ tài liệu sao,.. 

- Chất lượng cung cấp thông tin cho người dùng tin 

gồm:. 
+ Độ tin cây, 
+ Mức độ bao quát chủ đề, 
+ Múc độ chính xác, 
+ Mức độ đầy đủ: số lượng tài liệu / thông tin tìm được. 

Việc đánh giá theo 3 tiêu chuẩn trên được tiến hành một 
cách song song, nhưng thông thường người ta quan tâm 
nhất tới chất lượng thông tin được cung cấp cho người dùng 
tin. Vì đây là yếu tố chính, quan trọng nhất để đánh giá tính 
phù hợp của thông tin nhận được. 

Tuy nhiên, ngoài các tiêu chuẩn trên còn có một số cách 
đánh giá khác có liên quan tới hiệu quả của quá trình tra 
cứu. 

- Đánh giá các công cụ Íra cứu: 

+ Mức độ bao quát thông tin / tư liệu. 
+ Mức độ chính xác 





+ Tiện sử dụng. 

- Đánh giá mức độ bao phủ đề tài của hệ thống tìm 
tin. : 

Ví dụ: Hệ thống mục lục. 

+ Khả năng tra cứu được thông tỉn / tài liệu thích hợp 
trong thời gian ngắn nhất. 

+ Cung cấp nhiều điểm tiếp cận cho mỗi tài liệu. 

+ Chỉ tiết hoá các hệ thống tiêu đề, đề mục, hệ thống 
chỉ chô,.. trong hệ thống mục lục. 

a 3.2. Các chỉ số đánh giá hiệu quả tra cứu thông tin 

Hiệu quả tra cứu được xác định bằng một số công thức 
tính. Các công thức đó được thể hiện qua các chỉ số: Mức 
độ đầy đủ, mức độ chính xác, tính kịp thời, giá thành .... 

Để tính được các chỉ số cần xác định được: số tài liệu 
thích hợp, không thích hợp, tài liệu tìm được và không tìm 
được ở trong kho tư liệu. 

Giả sử ta có tập hợp a+b+c+d là tổng số tài liệu có trong 
kho hoặc tổng số biểu ghi trong cơ sở dữ liệu. 
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Trong đó: 

- Tập hợp a: Tài liệu thích hợp tìm được. 

- Tập hợp b: Tài liệu không thích hợp tìm được (rap tin, 
HÌHHIÊn tin}. 

- Fập hợp c: Tài liệu thích hợp không tìm được (mất 
tin). 

- Tập hợp d: Tài liệu không thích hợp, không tìm được. 

Tập hợp a+b+c+d thể hiện bằng ma trận như sau: 


Tài liệu thích | Tài liệu không 
hợp | thích hợp 


Số tải liệu tìm được 


Số lài liệu không fẦm C+D 
được 


Tổng số tài liệu AtB+C+D 


Dựa vào ma trận trên ta có thể tính được: 

Mức độ đây đủ: 

Kí hiệu là R: biểu thị bằng tỉ số giữa tài liệu thích hợp 
tìm được trên tổng số tài liệu thích hợp có trong cơ quan 
thông tin thư viện: 












a 
R=—— 
a+ec 


Mức độ chính xác: 
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Kí hiệu là P: biểu thị bằng tỉ số giữa Tài liệu thích hợp 
tìm được trên tổng số tài liệu tìm được. 


B=— 
a+b 





Tính kịp thời: 
Kí hiệu là O - biểu thị bằng tổng số chi phí thời gian tra 
tìm cho số lần tìm. 
c ¡=12 số lượng lần tra cứ 
O= Y tbpin ¡ =12....... n - số lượng lần tra cứu 
1=l 
Giá thành: 
Kí hiệu là C - biểu thị chỉ phí tiền và vật chất cho tra tìm 
một tài liệu. Nó được tính bằng chi phí bỏ ra để tra cứu toàn 
bộ tài liệu tìm được trong khoảng thời gian nhất định 


t 3nnì 


D 1 = 1.2.......n - số lượng lần tra tìm 
1 


Hệ số lao động: 
Kí hiệu là C - Biểu thị bằng tổng số chi phí laơ động bỏ 
ra cho việc tra cứu một tài liệu. 


=n 
V 2 Tpi ¡ = 12.......n - số lượng lần tra cứu 
i 
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Hệ số lựa chọn: 

Kí hiệu là J - Thể hiện số lượng công việc đã thực hiện 
trong quá trình tra cứu. Hệ số lựa chọn được tính bằng tổng 
số tài liệu đã tìm được trên tổng số tài liệu có trong kho 

Í= a+b 

a+b+c+d 

Hệ số kịp thời, giá thành và hệ số lao động của quá trình 
tra cứu thông tin phụ thuộc vào: 

- Tổ chức quá trình tra cứu 

- Sự hoàn thiện cơ sở vật chất, kỹ thuật của cơ quan 
thông tin - thư viện. 

- Trình độ chuyên môn, nghiệp vụ của cán bộ tra cứu 

- Quan hệ giữa cơ quan thông tin thư viện và người dùng 
tin. 

Bằng các tiêu chuẩn và chỉ số trên, cơ quan thông tin thư 
viện có thể phân tích, đánh giá được hoạt động tra cứu nói 
riêng và hoạt động thông tin nói chung để điều chỉnh, cải 
tiến công tấc của cơ quan mình, đồng thời dự báo được sự 
phát triển của của công tác này, nhằm đáp ứng nhu cầu đa 
dạng, phong phú của người dùng tín. 


- 
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CHƯƠNG 3 


PHƯƠNG PHÁP TRA CÚU THÔNG TIN 
TRUYÊN THỐNG 


Tra cứu thông tín truyền thống (Tra cứu thư mục) là 
phương pháp mà quá trình tra cứu được tiến hành thông qua 
bộ máy tra cứu/ các phương tiện và công cụ truyền thống 
(thủ công). Trong các cơ quan thông tin thư viện, người 
. dùng tin có thể hỏi: về một tài liệu cụ thể, hỏi một phần, 
một chương trong tuyển tập / cuốn sách bất kỳ, hỏi một tác 
giả cụ thể có những tác phẩm nào trong thư viện, hỏi về một 
vấn đề, để tài, hỏi các số liệu thống kê, thông số kỹ thuật 
liên quan đến loại máy móc thiết bị nào đó,...Các dạng câu 
hỏi trên ta có thể chía ra thành các dạng tra cứu sau: tra cứu 
thông tin tư liệu (tra tìm tài liệu) và tra cứu thông tin dữ 
kiện (tra tìm dữ kiện). 


1. TRA CỨU THÔNG TIN THƯ MỤC 

Tra cứu thông tin thư mục là qưá trình xác định và tách 
ra khỏi nguồn tìm kiếm các tài liệu tương ứng với yêu cầu 
thông tin theo các dấu hiệu cho trước như: tên tác giả, tên 
tài liệu, người dịch, tên nhân vật, địa danh, môn ngành trị 
thức, chủ đề, từ khoá,...). Kết quả của quá trình tìm tin là 
tài liệu gốc (bản sao tài liệu gốc), hoặc thông tin về tài liệu. 
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Ví dụ: 
Tìm tải liệu cụ thể như: “Thư mục học đại cương”, 
“Tin học trong hoạt động thông tin - thư viện ” 
Hoặc những thông tín về tài liệu như: Tác giả, dịch giả, 
người chủ biên, người hiệu đính, lần xuất bản, nơi xuất 
bản, nhà xuất bản, năm xuất bản, thời gian nộp lưu chiểu,... 
Ví dụ: 
Tìm tên tác giả của tài liệu "Định chủ đề tài liệu”? 
Năm xuất bản của tài liệu "Tin học trong hoạt động 
thông tin - thư viện '?,... 
Để tìm tài liệu cần phải dựa vào bộ máy tra cứu. 
nñ ï.i. Nguồn tra cứu chính 
- Hệ thống mục lục và các bộ phiếu tra cứu: 
+ Mục lục chữ cái (được tổ chức theo vần chữ cải: 
Tiếng Việt và các ngôn ngữ hệ Latnh A - Z 
Tiếng Nga: hệ KIRINLIC 
Tiếng Trung Quốc, Nhật Bản, Hàn Quốc 
+ Mục lục phân loại: Hiện tại trong các cơ quan thông 
tin - thư viện trên thế giới đang tồn tại một số bảng phân 
loại: DDC, UDC, LOC, BBK,... Do đó khi cơ quan sử dựng 
bảng phán loại nào để phân loại tài liệu thì rổ chức mục lực 
phán loại theo bảng đó. 
+ Mục lục chủ để: Mục lục chủ để được xây dựng theo 
vần chữ cái các đề mục chủ đề: 
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Hệ latinh: tiếng Việt, tiếng Anh, tiếng Pháp, 
Hệ KIRINLIC: tiếng Nga: 

+ Mục lục địa chí,... 

- Các bộ phiếu tra cứu 

+ Bộ phiếu tra cứu chính, 

+ Bộ phiếu tra cứu chuyên đề 

- Ấn phẩm thông tin: 

+ Ấn phẩm thông tin thư mục, 

+ Ấn phẩm thông tin tóm tắt, 

+ Ấn phẩm thông tin hỗn hợp. 

- Bản thư mục: . 

+ Thư mục chuyên đề, 

+ Thư mục giới thiệu, 

+ Thư mục địa chí,... 

n 1.2. Phương pháp tra cứu 

1.2.1 Tra cứu qua hệ thống mục lục phiếu 

Dạng tra cứu thông tin này phải dựa vào các thuật ngữ 
chính xác: đó là các từ mô tả như: Tên tác giả, tên tài liệu, 
nhà xuất bản, địa danh,.. hoặc các dấu hiệu đặc trưng chơ 
yêu cầu như: Đề mục chủ để, môn ngành tri thức/ linh vực 
khoa học và thường bát đầu từ những khái niệm quan trọng 
nhất, sau đó có thể thu hẹp (mở rộng) phương pháp tìm với 
sự giúp đỡ của các hệ thống tra cứu chỉ chỗ qua lại, các 
quan hệ giữa các thuật ngữ với nhau. 
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Hệ thống mục lục phiếu (Hệ thống mục lục thư viện) 
là nguồn tra cứu quan trọng và thông dụng trong các thư 
viện, vì nó liệt kê một cách hệ thống tất ca tài liệu có ở 
trong thư viện, cho phép tìm được vị trí (địa chỉ) lưu trữ tài 
liệu trong kho của một /một số cơ quan thông tin thư viện, 
với điều kiện người tìm tin biết một / các thông tin về tài 
liệu như: tác giả của tài liệu, tên tài liệu, nội dung của tài 
liệu: chủ đề, hay môn ngành khoa học. Tùy thuộc vào cách 
tổ chức mục lục mà người ta sử dụng tới các nhóm thông tin 
về tài liệu khác nhau để tra cứu trong mục lục tương ứng. 

- Mục lục chữ cái (MLCC) cho phép tìm tài liệu theo 
tên tác giả, tên tài liệu, tổng số tài liệu của một tác giả được 
xuất bản và lưu trữ ở kho của thư viện, cơ quan thông tIm. 

Ví dụ: 

* Ai là tác giả của tiểu thuyết "Chú nhóc đen"? 

Phương pháp tra cứu: MLCC: VânC-CH: Chư 
nhóc den 

Tác giả: R. Raitơ. 

* Nguyễn Thuy Ứng dịch tiểu thuyết nào xuất bản năm 
1983? 

Phương pháp tra cúu: MLCC: Vần: N - Nguyễn 
Thuy Ứng: Người dịch. 

Tiểu thuyết:. Sông Đông êm đểm/ M. Sôlôkhốp.- Tiểu 
thuyết. (Bản dịch mới) 


* Cho biết nhà xuất bản tài liệu “Món än Huế”? 
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Phương pháp tra cứu: MLCC: Vân: M - Món ăn 
Huế. 

Tài liệu: Món ăn Huế do nhà xuất bản: Phụ nữ xuất bản 

- Mục lục phân loại (MLPL): cho phép tìm tài liệu theo 
môn ngành khoa học (lĩnh vực hoạt động). Mỗi mục lục 
phân loại có cách tổ chức tổ chức riêng tuỳ theo khung phân 
loại được áp dụng ở cơ quan thông tin thư viện cụ thể. 

Thông thường mỗi cơ quan thông tin thư viện chỉ tổ chức 
phân loại và xây dựng mục lục phân loại của mình theo một 
hoặc hai bảng, song trên thực tế có không ít thư viện tồn tại 
đồng thời nhiều mục lục phân loại (đa phần do hoàn cảnh 
lịch sử để lại). Ví dụ ở Thư viện Quốc gia Việt Nam tên tại: 

Mục lục phân loại: 

+ Theo Bảng Trng tiểu hình của Trung Quốc 

+ Theo Bảng phân loại của Thư viện Quốc gia (Địch và 
Biên soạn từ Bảng phân loại dành cho thư viện tỉnh, thành 
phố của Liên Xô). 

+ Theo bảng phân loại bộ BBK rút gọn. 

Thư viện Khoa học và Kỹ thuật Trung ương (thuộc Trung 
tâm Thông tin KH&CN Quốc gia) có: 

Mục tục phân loại 

+ Theo bảng phân loại Trung tiểu hình của Trung Quốc. 

+ Theo bảng phân loại BBK rút gọn, 

Đối với người tra cứu, để tra tìm được tài liệu theo môn 
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ngành trí thức phải nắm chắc cơ cấu từng bảng phân loại, 
đặc điểm của chúng mới có khả năng tra tìm một cách 
nhanh chóng và đầy đủ, đáp ứng yêu cầu của người dùng 
tin. 
Ví dụ: 
- Tìm các tài liệu vẻ khai thác Amiăng? 
Thư viện sử dụng Bảng Phân loại dùng cho các thư viện 
khoa hợc tổng hợp Năm 2002. 
Phương pháp tra cứu: 
MLPL, Mục: 6C]: Ngành khai mỏ, 
6C1.8: Khai thác các khoáng sản phi kim loại 
6C1.82: Khai thác mỏ vật liệu xây dựng và vật liệu làm 
đường giao thông 
Khai thác Amiăng thuộc: Khai thác mỏ vật liệu xây 
dựng và vật liệu làm đường giao thông. 
Như vậy, muốn tra cứu các tài liệu về khai thác Amiăng? 
cần tìm trong tiểu mục: 6C1.82 
Bảng Phân loại Thư viện - Thư mục (BBK) với câu hỏi 
trên sẽ tìm: 
G: ngành mỏ 
G 31/34: Khai thác mỏ từng loại 
G 34: Khai thác mỏ khoáng sản rắn phi quặng (Phi 
kim loại) 
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G 342: Khai thác mỏ vật liệu xây dựng và làm đường. 
Muốn tra cứu các tài liệu về khai thác Amuăng? Tài 
liệu có ở tiểu mục: G342 

- Tìm các tài liệu về Bệnh run ¡ay? 

Phương pháp fra cứu: 

Tương tự như cách tra cứu trên: sử dụng Bảng Phân 
loại dùng cho các thư viện khoa học tổng hợp của Thư viện 
Quốc gia, năm 2002. ỉ 

MLPL, 61: Y học. Y tế 

617.9 Bệnh lý thần kinh 

617.919: Các bệnh khác của hệ thần kinh 

Các tài liệu về Bệnh run tay, có ở tiểu mục: 617.919 
BBK: 

N: Y tế. Các khoa học y học. 

N 61 /64 Bệnh lý thần 

N62: Bệnh lý thần kinh 

N 629: Các bệnh khác của hệ thần kinh 

Các tài liệu về Bệnh run tay, có ở tiểu mục: N629 

- Mục lục chủ đề (MLCĐ): cho phép tìm được tin theo 
các đề mục chủ đề. 

Tại các thư viện, MLCĐ được xây dựng trên cơ sở Bảng 
Đề mục chủ đề của Thư viện Quốc hội Mỹ (LCSH), 
Bảng Đề mục chủ để của Thư viện Quốc gia Pháp 
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(RAMEAU) hay bảng đề mục chủ để do thư viện tự xây 
dựng như Bảng phân loại chủ để của Đại học Y Hà nội. 

Ví dụ: 

- Tìm các giáo trình về töiêu hoá có tại thư viện trường 
đại học Y Hà nội. 

Phương pháp tra cứu: 

Đề mục chủ đề, 

Chủ đề: Tiêu hoá: T 8, 

Giáo trình: 01 

Muốn tra tìm tài liệu: Giáo trình tiêu hoá:, ta tìm đến T 
8.0I 

Giáo trình tiêu hoá: T 8. 1 

- Tìm các tài liệu đề cập tới phật giáo Việt Nam. 

Tại Thư viện Quốc gia Việt Nam có MLCĐ (sách từ 
1954 - 1960) với hơn 2000 đề mục. 

Phương pháp tra cứu: 

Đẻ mục chủ đề, 

Chủ đề: phật giáo: Việt Nam. 

Các tài liệu đề cập tới phật giáo Việt Nam có ð Chủ đề: 
phật giáo: Việt Nam. Tuy nhiên sách chỉ có đến 1960, 
muốn tra tìm tài liệu mới hơn có thể tra tìm trong 
MLPL/(BBK: 3 


X tôn giáo. Chủ nghĩa vô thần 
X3 Từng lơại tôn giáo 
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X3.... Phật giáo 

X3...(2) phải giáo Việt Nam 

Qua hệ thống mục lục có thể lựa chọn tài liệu bằng việc 
kết hợp và sử dụng các thông tin khác nhau về tài liệu mà 
chúng không được sử dụng làm dấu hiệu để xây dựng mục 
lục như: 

+ Các thông tin về xuất bản: Nơi xuất bản, nhà xuất bản, 
năm xuất bản 

+ Các thông tin về đặc điểm số lượng của tài liệu: số 
trang, số khổ, số liệu minh hoạ... 

1.2.3. Tra cứu qua ấn phẩm thông tin, các bản thư mục 
và mục lục In 

Dạng tra cứu này được tiến hành giống như dạng tra tìm 
qua hệ thống mục lục. Tốc độ tra cứu ở đây phụ thuộc vào 
mức độ phức tạp của biểu thức phản ánh yêu cầu, cách tổ 
chức các hình thức lưu trữ và khả năng tra cứu thông tin của. 
các công cụ được sử dụng. 

Mọi việc tra cứu đều được bắt đầu từ những thông tin 
quan trọng nhất liên quan tới nội dung hoặc hình thức cụ 
thể của tài liệu, sau đó những thông tin khác cũng cần được 
kiểm tra để yêu cầu được thoả mãn một cách chính xác. 

Trong ấn phẩm thông tin hay bản thư mục, thời gian và 
khả năng tra tìm thông tin phụ thuộc vào nguyên tắc sắp 
xếp các biểu ghi thư mục, các bài tóm tất và hệ thống các 
bảng tra cứu, bổ trợ của thư mục / ấn phẩm, nếu hệ thống 
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các bảng tra cứu, bổ trợ phong phú, đa dạng thì khả năng 
truy nhập được thông tin theo nhiều khía cạnh khác nhau 
một cách nhanh chóng, đây đủ. 

Trong khi tiến hành tra cứu, nhiệm vụ của người tìm tin 
là xác định dạng tìm tin đó thuộc loại nào?, theo hình thức: 
tìm tên tác giả, tên tài liệu, các yếu tố xuất bản; hay nội 
dung tài liệu tìm theo chủ đề, môn ngành khoa học, từ khóa 
/ các dạng thông tin khác thích hợp với thuật ngữ tìm của 
yêu cầu, trên cơ sở đó xác định các bảng tra cứu, chỉ dân 
phù hợp với yêu cầu. 

Để thực hiện việc tìm tin có hiệu quả, với những vấn đề 
mới chưa cập nhật và lĩnh vực chuyên môn không thật am 
hiểu, trước hết phải tham khảo các tài liệu để nắm khái 
niệm liên quan tới các thuật ngữ, xãn đề hoặc lĩnh vực cần 
tìm qua tài liệu tra cứu như: bách khoa thư, từ điển bách 
khoa, từ điển và số tay tra cứu chuyên ngành hoặc các sách 
giáo khoa, giáo trình, tổng quan,.... 

Để giúp tìm tin nhanh chóng, đầy đủ trong thư mục, mục 
lục in (đưới dạng sách) hoặc ấn phẩm thông tin thông 
thường có các bảng tra cứu chỉ dẫn như: 

+ Bảng tra tác giả (Author Index) 

+ Bảng tra chủ đề (Subject Index} 

+ Bảng tra từ khoá (Keyword Index) 

+ Bảng tra văn bằng phát minh (Patent Index) 
+ Bảng tra công thức (Formule Index) 
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. Bảng tra công thức chung 
. Bảng tra công thức hợp chất hệ vòng 
+ Bảng tra khái niệm (Concept Index) 
+ Bảng tra chung (Semi-annual Commulative Index 
(nửa năm), Comrmulative Index (cả năm),... 

Khi tra cứu phải xác định rõ một hoặc một vài yếu tố 
như: lĩnh vực khoa học, chủ đề, từ khoá, tên tác giả, tên tài 
liệu / văn bằng phát minh, công thức hoá học, ...liên qua tới 
yêu cầu, sau đó xác định các bảng tra tương ứng để tầm. 
Mỗi loại ấn phẩm thông tin có các bảng tra cứu phù hợp với 
nội dung tài liệu mà chúng phản ánh. 

Tham khảo một số ấn phẩm thông tin nước ngoài và 
Việt Nam sau: 

1. Tạp chí tóm tắt hoá học Mỹ (Chemical Abstracts) 


Cơ quan xuất bản | Hội hoá học Mỹ (Ohio). 1907- 


Định kỹ xuất bản Hàng tuần + các bảng chỉ dẫn. Dưới dạng giấy + 
CD-ROM 


Phạm vi bao quát - Giới thiệu các tài liệu khoa học kỹ thuật thế giới, 
các bài báo, tạp chí, công trình hội nghị, luận án, 
báo cáo, văn bằng phái minh về hoá học và 
















tài liệu 






công nghệ hoá học. 
- Hàng năm giới thiệu khoảng 240.000 bài tớm 
tắt. 
Mã số (số tập, số thứ tự bài). Tên tư liệu bằng 
tiếng Anh. Tác giả (nơi công tác của tác giả). 


















Cách trinh bày bài 


tóm tắt 
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Tên nguồn dẫn tư liệu (ngôn ngữ của tư liệu 
nguyên bản). Tóm tất 
Bảng chỉ dẫn / | - Trong mỗi số có các bảng chỉ dẫn: 
bảng tra cứu + Từ khoả 
| + Văn bằng phát minh 
l + Tác giả 
¡ - Bảng chỉ dẫn chung (B tháng) (Semi - annual 
: commulative) 
+ Chủ đề: chung, các chất 
+ Công thức: công thức chung, công thức hợp 
chất hệ vòng 
+ Chỉ dẫn tác giả 
+ Chỉ dẫn văn bằng phát minh. 





Phương pháp tra | -Tra cứu tin hiện tại: 


cứu thông tìn ¡ + Theo từng vấn để trong mục lục của ấn phẩm 
+ Theo bảng chỉ dẫn kèm theo mỗi số (dựa vào 
dấu hiệu †ìm kiếm.) 
- Tra cứu tin hồi cố 
+ Theo các bảng chỉ dẫn chưng (dựa vào các 


dấu hiệu tìm kiếm) 





| + Theo từng số. 


l0 








2. Tạp chí tóm tất sinh vật Mỹ (Biological 
ABSTRACTS) 


Cơ quan xuất bản Trung tâm dịch vụ thông tin sinh vật 
Philadenfia). 1927- 


Định kỳ xuất bản 24 số / năm + một bản chỉ dẫn 


Phạm vi bao quát tài | - Giới thiệu về tài liệu khoa kỹ thuật thế giới về 
liệu sinh vật học và các ngành trí thức có liên quan. 


- Hàng năm giới thiệu khoảng 70.000 bài tóm 
tắt, 
Cách trình bày bài - Số thứ tự. Tên tác giả (địa chỉ cơ quan của tác 
tôm tắt giả). 
- Tên tài liệu bằng tiếng Anh. Nguồn dẫn tài 
liệu (ngôn ngữ của tài liệu nguyên bản). Tôm 


- Theo phân loại khoa học. 


- Trong mỗi số 
+ Bảng chỉ dẫn tác giả (author Index) 


Bảng chỉ dẫn /bảng | +Bảng tra phân loại sinh vật (Biosystemetic 
tra Index) 


+ Bảng tra khái niệm (consept Index) 
+ Bảng tra chủ đề (Subject tndex) 


- Bảng chỉ dẫn chưng (Semi - annual 
commulative): 6 tháng 


Phương pháp tra cứu | - Tra cứu tin hiện tại: 
thông tin + Dùng các bảng tra trong mỗi số. 


+ Theo mục lục của ấn phẩm 
- Tra cứu tin hồi cố: 


+ Dùng các bảng chỉ dẫn chung 
+ Tìm theo tủ 





Lối 


3. Tạp chí tóm tát nông nghiệp AGRINDEX 









F—— 


Cơ quan xuấi bản - Hệ thống Thông tin Quốc tế về nông lương, 


liên hợp quốc (Viên) 

- 12số/năm + 1 bản chỉ dẫn chung. 

- Dưới dạng giấy + CD-ROM 

- Giới thiệu về tư liệu khoa kỹ thuật thế giới liên 
quan đến nông nghiệp 

- Hàng năm giới thiệu khoảng 100.000 bài tóm 
tắt. 

- Mã số (năm, số thứ tự). Tên tư liệu nguyên bản 
[Tên tư liệu dịch sang tiếng Anh]. [Mã ngôn 
ngữ]. Tác giả (địa chỉ nơi công tác của tác giả). 
Nguồn dân tư liệu. Từ khoá theo AGROVOC. 
- Theo phân loại khoa học 








— 





Định kỹ xuất bản 


















Phạm vi bao quát tài 
liệu 






























'Cách trình bày bài 
tóm tắt 


Bảng chỉ dẫn / tra 
cứu 








- Trong mỗi số: tra cứu theo: 

+Bảng tra tác giả (cá nhân) 

+ Bảng tra tác giả (tập thể) 

+ Bảng tra các báo cáo 

+ Bảng tra chủ đề 

- Bảng chỉ dẫn chung (Agrindex Commulative 
Index) - † năm: tra cứu theo: 

+ Tác giả cá nhân 
+ Tác giả tập thể 
+ chủ đề 

- Tra cứu tin hiện tại: 
+ Theo mục lục của ấn phẩm 

+ Dùng các bảng tra kèm theo mỗi số 
- Tra cứu tin hồi cố 

+ Dùng bảng tra chung 

+ Theo mỗi số lẻ 


























Phương pháp tra cứu 
thông tin 
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4. Tạp chí tóm tắt của Nga (Referativnưi Zhurnal) 



















Cơ quan 


Viện thông tin khoa học kỹ thuật toàn liên bang 
xuất bản 


VINITI .1953- 

12số, 24số / năm, có † bảng tra cứu chủ đề và 1 
bảng tra cứu tác giả chung. 

Xuất bản dưới dạng giấy, Microfilm và CD-ROM 
- Giới thiệu tài liệu khoa học tự nhiên, khoa học kỹ 
thuật và khoa học ứng dụng. 

- Phản ánh hơn 17.000 tạp chí, 19.000 sách, hơn 
230.000 văn bằng phát minh của 130 nước, bằng 66 
thứ tiếng khác nhau trên thế giới. 

- Hàng năm giới thiệu khoảng 1.300.000 bài tóm tắt 
dưới dạng: Các tập liên hợp, Tập riêng biệt và các 
Tập lẻ về các bộ môn khoa học. Mỗi loại đều có mã 
số riêng. 

- Mã số (số thứ tự tập, mã loại, số thứ tự bài). Tên tài 
liệu dịch sang tiếng Nga (lên nguyên bản) / tên tác 
giả /! tên nguồn dẫn tư liệu....mã ngôn ngữ. Tóm tắt 










Định kỳ xuất 
bản 




















Phạm vi bao 
quát tài liệu 





















Cách trình 
bày bài tóm 


tắt - 








- Khung đề mục của hệ thống khoa học kỹ thuật Quốc gia. 
Danh mục để mục in trong số một hàng năm 
- Trong mỗi số: 
+ Bảng tra văn bằng phát minh xếp theo số thứ tự 
+ Bảng tra tác giả 
+ Bảng tra chủ đề 
- Hàng năm: 
+ Bảng tra chủ đề 
+ Bảng tra công thức hoá học 
+ Bảng danh mục nguồn trích dẫn tài liệu 
+Bảng tra tác giả 
+ Bảng phân loại sinh vật 
- Tra cứu tin hiện tại: 
+ Theo đề mục ở mỗi số 
+ Theo các bảng tra trong mỗi số. 
- Tra cứu tin hổi cố: 
+ Dùng bảng tra cứu chung của năm. 
+ Dùng bảng tra trong từng số lẻ. 
























Bảng tra cứu 
/ chỉ dẫn 


























Phương 
pháp tra cứu 
thông tin 
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5. Tạp chí Thông tin tín hiệu của Pháp (Bulletin 
signalitique) 











Cơ quan xuất bản Trưng tâm thông tin KHKT quốc gia Pháp 
CNRS 
Định kỷ xuất bản 12 số / năm + 1 bản chỉ dẫn chung dưới dạng 
giấy + CD ROM 
Giới thiệu các tài liệu KHKT thế giới, các bài 
báo của 9.000 loại ấn phẩm định kỳ; Công 
trình hội nghị, lưận án, báo cáo,... 
Hàng năm giới thiệu khoảng 800.000 bài mô 
tảä thự mục. 
- Cô 63 loại. Mỗi loại có mã số riêng giới thiệu 
các tài liệu cụ thể về một ngành cụ thể trong 
lĩnh vực khoa học chính xác. công nghệ, các 
khoa học trái đất, sinh y học, các ngành kỹ 
thuật. 
- Mã số (năm, mã loại, số thứ tự bài). Tên tài 
liệu (nguyên bản). tên tác giả (địa chỉ nơi công 
tác của tác giả). Nguồn dẫn (nguồn trích dẫn) 
tài liệu. Từ khoá hoặc thõng tin chú thích. 
- Theo phân loại khoa học 
- Trong mỗi số: 

+ Bảng tra tác giả 

+ Bảng tra chủ đề 

+ Theo ký hiệu phân loại 
- Hàng năm: 

+ Bảng tra chủ đề 

+ Bảng tra luận án 

+ Bảng tra báo cáo 

+ Bảng tra biên bản hội nghị 

+ Danh mục nguồn đẫn tài liệu 
-_ Tra cứu tin hiện tại: 

+ Tra theo bảng chỉ dẫn cho mỗi số 

+ Theo từng vấn đề của khung phân loại 
- Tra cứu tin hồi cố: 
Tra theo các bảng tra chung 
















Phạm vi bao quát 
tài liệu 
























Cách trình bày 

















Bảng tra cứu / chỉ 
dân 




















Phương pháp tra 
cứu thông tin 
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6. Tạp chí tóm tát tài liệu khoa học và công nghệ 


Việt Nam 
Cd quan xuất bản Trụng tâm Thông tin Khoa học và Công 
nghệ Quốc gia (1977- 


Định kỳ xuất bản - 12 số / năm & các bảng tra(trong mỗi sở). 
- Bảng tra chung: tác giả (cả năm 


- Giới thiệu các dạng tài liệu khoa học 
công nghệ Việt Nam: tạp chí, sách, tài liệu 
hội nghị, báo cáo kết quả nghiên cứu, luận 
ản tiến sĩ và tiến sĩ khoa học bảo vệ trong 
nước, thông báo tóm tắt các đề tài nghiên 
cứu khoa học công nghệ đang tiến hành. 
- Chỉ số khung đề mục quốc gia. 
- Mã số tài liệu, số thứ tự. Tác giả. Tên tài 
liệu / báo cáo / luận án; tóm tắt. từ khoá. 
Nơi lưu trữ tài liệu; nguồn tai liệu, số liệu 
xuất bản. chỉ số ISSN của tạp chí. 
- Trong mỗi số: 

+ Bảng tra tác giả 

+ Bảng tra từ khoá 

+ Bảng tra địa lý 

+ Bảng tra Kết quả nghiên cứu (đề tài 
đang tiến hành) 
- Hàng năm: Bảng tra chung + Bảng tra tác 
giả 


















Phạm vi bao quát tài 
liệu 























Cách trình bày bài tóm 
tắt 















Bảng tra cứu / chỉ dẫn 



















- Tra cứu tin hiện tại: 
+ Theo từng vấn để của khung đề mục 

+ Dùng bảng tra cứu - chỉ dẫn trong mỗi số 
- Tra cứu tin hồi cố: 

+ Bảng tra chung: Tần tác giả 

+ Theo bảng tra từng số lẻ của các năm 






Phương pháp tra cứu 
thông tin 
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7. Thư mục quốc gia Việt Nam 


















Cơ quan xuất bản Thư viện Quốc gia Việt Nam (Hà Nội). 


1957- 


- Hàng năm: 1số / năm 
- Giới thiệu các xuất bản phẩm của Việt Nam 
được xuất bản trong nước: sách, kỷ yếu, tổng 
kết công trình nghiên cứu khoa học, tranh 
ảnh, bản nhạc, lịch.... 
- Mã số (số thứ tự ). Tên tác giả. Tên tài liệu 
(bằng ngôn ngữ gốc., tên tài liệu dịch sang 
tiếng quốc ngữ. 
- Nơi xuất bản, nhà xuất bản. Khổ. Ký hiệu 


- Theo phân loại khoa học (BBK 


~ Trong năm (Thư mục Quốc gia / năm) 
+ Bảng tra lên sách 
+ Bảng tra tên tác giả 
+ Bảng tra tên dịch giả 
+ Bảng tra cơ quan xuất bản, nhà xuất bản 
~ Tra cứu tin hiện tại: 
+ Theo nh vực khoa học (Bảng phân loại 
BBK) trong thư mục của từng số 
- Tra cứu tin hổi cố: 
+ Theo các bảng tra trong Thư mục Quốc 
gia / năm 
+ Theo từng vấn đề trong mục lục 
+ Theo từng số lẻ của năm 











Định kỳ xuất bản 
Ị 


1 





Phạm ví bao quát tài 
liệu 





—— 





Cách trình bày 


















¡ Bảng tra cứu / chỉ dẫn 



















Phương pháp tra cứu 
thông tin 


Các bản thư mục, tạp chí tóm tắt, mục lục dạng ¡n...là 
công cự giúp cho việc tìm tín hồi cố và hiện tại một cách 
nhanh chóng, thuận tiện và đầy đủ. Đặc biệt, tạp chí tóm tắt 
với cách biên soạn, sắp xếp khoa học, có các công cụ làm 
việc thiết thực như: 
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+ Danh mục tên các tạp chí có bài được trích dân (Danh 
mục nguồn trích) 

+ Tên viết tất của các cơ quan tổ chức 

+ Từ viết tắt,... 

Tạp chí tóm tất phản ánh thông tin kịp thời, đa dạng vẻ 
tài liệu, đặc biệt là thông tin về văn bằng phát mình sáng 
chế giúp cho các nhà khoa học nghiên cứu không bị trùng 
lặp, tiết kiệm được công sức cũng như thời gian của họ. Tạp 
chí tóm tắt phản ánh đầy đủ những thành tựu khoa học kỹ 
thuật mới nhất trên thế giới, nhằm khắc phục những trở ngại 
trong quá trình thông tin bị phân tán và là công cụ hữu hiệu 
làm giảm thiểu những trở ngại do hàng rào ngôn ngữ tạo ra, 
trong nhiều trường hợp người dùng tin không phải tìm đọc 
tài liệu gốc. 

So với hệ thống mục lục thư viện, các ấn phẩm thông tin 
và mục lục đạng ¡n tiết kiệm thời gian tra tìm thông tin một 
cách đáng kể. 

Vị du: 

* Nêu tên sách và những bài báo của tác giả Võ Quý 
đăng trong các tạp chí từ năm 2000 đến 2004? 

Nguồn tìm và phương pháp tìm tin: 

1 - Thư mục Quốc gia Việt Nam / Năm 2000 - 2004. 

. Bảng tra: Tác giả (Sắp xếp theo vần chữ cái Họ -Tên 
tác giả) 

Vân: V - Võ Quý 
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2- Tạp chí tóm tất tài liệu khoa học và công nghệ Việt 
Nam. Năm 2000 - 2004. 

. Bảng tra: Tác giả (Sắp xếp theo vần chữ cái Tên - Họ 
tác giả) 

Văn: Q - Võ Quý; Từ năm 2000: Theo bảng tra chung: 
tên tác giả / năm: 2000, 2001, 2002,2003 và theo từng số lẻ 
năm 2004. 

Ví dụ: Bảng tra Tác giá Võ Quý năm 2002: 2002. 10/ 
617, 2002.11/ 028 Cụ thể: 

- 2002. 10/ 617. Võ Quý. Khảo cổ học Cao Bằng.- Khảo 
cổ học, 2001, N.2, 26 - 37. 

- 2002. 11/028. Võ Quý. Về vấn đề quản lí vùng đệm ở 
Việt Nam, những khái niệm bước đầu.- Ký yếu hội thảo 
quốc tế vùng đệm các khu bảo tồn thiên nhiên Việt Nam, 
2002, tr: 42 - 40. 

. Bảng tra: Tác giả Võ Quý năm 2003: 2003.04/ 704, 
2003.06/ 647, 2003.08/ 033 Cụ thể: 

- 2003.08/ 033. Võ Quý. Khảo cổ học Lâm Đồng.- Khảo 
cổ học, 2003, N.2, 33- 47. 

- 2003.06/ 647. Võ Quý. Tổng quan môi trường miễn núi 
Việt Nam trong 20 năm qua: thực trạng và những vấn đề đặt 
ra.- Phát triển bền vững miền núi Việt Nam 

- I0 năm nhìn lại và những vấn đề đặt ra.- 2002, tr: 98 - 
115. 

- 2003.04/ 704. Võ Quý. Cân phải làm gì để thúc đẩy 
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công tác bảo tồn đa dạng sinh học ở Việt Nam?.- Thông tín 
những vấn đẻ sinh học ngày nay, 2002, vol. §, N.4, 57 - 
39,.. 

Với các kết qủa trên cùng tác giả Võ QOxý nhưng nghiên 
cứu 2 linh vực hoàn toàn khác nhau. Trong trường hợp này, 
Người tìm tin phải trực tiếp trao đổi với NDT để xác định 
họ cần tìm hiểu tài liệu của tác giả nào? thuộc lĩnh vực khoa 
học nào? Trên cơ sở đó đáp ứng yêu cầu và còn có thể giúp 
họ tra cứu được những thông tin về lĩnh vực họ cần mà chưa 
cập nhật được. 

3- Mục lục chữ cái (tại các thư viện) 

Vần: V- Võ Quý 

* Cho biết tên các để tài luận án tiến sỹ về y học thực 

hành bảo vệ từ năm 2000 - 2003. 
Nguồn tìm và phương pháp tìm 

{- Tạp chí tóm tắt tài liệu khoa học và công nghệ Việt 
Nam. Năm 2000 - 2003 

- Bảng tra: Từ khoá mỗi số riêng biệt (Sắp xếp theo vần 
chữ cái từ khoá): 

Vân Y: Ÿ học thực hành 

- Bảng đề mục: 76.29 Y học thực hành ( luận án) (Theo 
từng số lẻ trong năm) 

2 - Mục lục luận án tiến sỹ, tiến sỹ khoa học (Thư viện 
Quốc gia VN) 
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* Cho biết tên của địch giả của tiểu thuyết Cây sối mùa 
đóng. 
Nguồn tìm và phương pháp tìm tỉn: 
1- Thư mục Quốc gia Việt Nam / năm (1983) 
. Bảng tra: Tên sách (Sắp xếp theo vần chữ cái): 
VânC- Cây sổi mùa đông 1133 
Dịch giả: Phạm Mạnh Hùng 
. Mục lục (Sắp xếp theo BBK) 
K31 - Tác phẩm văn học: Tiểu thuyết , truyện 
Cây sồi mùa đông 1 ]33 
11323 Cây sói mùa đông 
Dịch giả: Phạm Mạnh Hùng 


2 - Mục lục chữ cái: (Thư viện Quốc gia Việt Nam và 
nhiều thư viện khác). 


Vân: C_- Cây sôi mùa đông 
Dịch giả: Phạm Mạnh Hùng 
# Tìm các lài liêu có để cập tới Ngón ngữ học xuất bản 
năm 2002 
Nguôn tìm và phương pháp tìm 
- Thư mục Quốc gia Việt Nam / năm 2002 
.J- Ngôn ngữ (Theo Bảng phân loại BBK) 


- Mục lục phân loại: I- Ngón ngữ (Theo Bảng phân loại 
BBK) 
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Tra cứu Thư mục trích dẫn tạp chí khoa học. 

Thư mục trích dẫn tạp chí khoa học (Science Citation 
Index) là một dạng sách có cấu trúc gồm các tài liệu trích 
dân đến một tập hợp tài liệu phản ánh về (hoặc) có liên 
quan đến một chủ đề xác định. 

Đối tượng được phản ánh trong thư mục trích dẫn tạp chí 
khoa học là các tai liệu trích dân (Citing Documents) và các 
tài liệu được trích dẫn (Cited Documens). 

Người tìm tin sử dụng chỉ dẫn chủ đề hoán vị. Trước tiên 
xác định chủ để cần tìm trong thư mục trích dẫn tạp chí 
khoa học. : 

Có thể thực hiện một trong số các kỹ thuật tìm tin sau: 

- Trường hợp đã biết một số tác giả trích dẫn hoặc được 
trích dân: 

Từ tên tác giả được trích dẫn người tìm sử dựng thư mục 
trích dẫn và sau đó xác định được tên tài liệu được trích dẫn 
và trở lại thư mục nguồn để xác định các thông tin thư mục 
đầy đủ vẻ danh sách tài liệu cần tra cứu. 

- Trường hợp không xác định được tên tác giả cụ thể: 

Người tìm tin có thể sứ dụng trực tiếp (hoặc) thư mục 
nguồn hoặc thư mục trích dân để xác định được danh mục 
tài liệu đề cập tới một chủ đề xác định (với điều kiện danh 
mục tài liệu đó được công bố trên các tạp chí xác định). 

Tra cứu trong thư mục trích dẫn tạp chí khoa học ngày 
càng phát triển đáp ứng yêu cầu tin của cán bộ khoa học và 
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công nghệ, các cán bộ quản lý khoa học, hoạt động sản 
xuất, thông tin khoa học công nghệ (bổ sung nguồn tin....) 

Như vậy là cùng với tạp chí tóm tắt, thư mục chuyên đề, 
thư mục chuyên ngành, thư mục trích dẫn tạp chí khoa học 
giúp cho người dùng tin kiểm soát được một cách đầy đủ, 
toàn diện tới nguồn tài liệu phản ánh về / hoặc có liên quan 
với một chủ đẻ xác định (hạn chế những trở ngại của quá 
trình phân tán thông tin gây nên) và điều đó không phụ 
thuộc vào các tài liệu đó được lưu giữ ở thư viện nào, thể 
hiện bằng ngôn ngữ nào (hạn chế được trở ngại do hàng rào 
ngôn ngữ tạo nên). 


2. TRA CỨU SỐ LIỆU VÀ DỮ KIỆN 

Tra cứu thông tin dữ kiện (số liệu, dữ kiện) là một dạng 
tra cứu rất thông dụng tại các cơ quan thông tin, thư viện, 
đặc biệt trong nền kính tế thị trường và khoa học - công 
nghệ phát triển. Tra cứu thông tin dữ kiện là quá trình tách 
ra khỏi nguồn tìm những số liệu, dữ kiện liên quan tới một 
đối tượng nào đó như: Số liệu thống kê, tính chất của vật, 
vật liệu, tính năng kỹ thuật của máy móc thiết bị... 

Hệ thống phiếu tra cứu dữ kiện thường thường được xây 
dựng ở các cơ quan thông tin thư viện chuyên ngành, các hệ 
thống thông tin hành chính, các cơ sở sản xuất - kinh 
doanh. 

na 2.1. Nguồn tra cứu chính 

- Bộ phiếu tra cứu dữ kiện: 
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Bộ phiếu tra cứu về vật liệu, 

Bộ phiếu tra cứu về máy móc, thiết bị, 

Bộ phiếu tra cứu về quy trình công nghệ... 

- Tài liệu tra cứu gồm: 

Bách khoa thư, 

Từ diển, 

Sách tra cứu chuyên ngành, 

Almanach, 

Tập bản đồ (Atlas), 

Sách tra cứu địa lí (Gazetieers), 

Niên giám,... 

Ngoài các nguồn tra cứu thông dụng trên, thông tin về 
các dữ kiện còn có thể tra cứu trong một số nguồn khác 
như: nguồn tra cứu về các tổ chức chính trị - xã hội, nguồn 


tra cứu về tiểu sử - nhân vật, nguồn tra cứu về các ấn phẩm 
Công,... 

a 2.2. Phương pháp tra cứu 

Khác với tra cứu thông tin thư mục, tra cứu thông tin đữ 
kiện là việc tra cứu các số liệu, đữ kiện có trong bản thân tài 
liệu như: Các số liệu thống kê, thời gian, công thức hoá học, 
tính chất của vật liệu, thông số kỹ thuật của máy móc thiết 
bị, khái niệm khoa học.... 

Ví dụ: 

- Vua Lê Thánh Tông lên ngôi năm nào? Trụ trì bao 
nhiêu năm? 
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- Ngôi sao bóng đá Maradona đã từng tham gia những 
câu lạc bộ bóng đá nào ở châu Âu? 

- Thủ tướng Trung Quốc hiện nay là ai? Vài nét về tiểu 
sử? 

- Năm 2003 Việt Nam xuất khẩu bao nhiêu tấn gạo? 

- Cho biết công thức hàm (toán học) exponenta? 

- Giải thích thuật ngữ Engim?,... 

Tại các cơ quan thông tin thư viện, các cơ quan thực hiện 
dịch vụ hỏi -đáp, tra cứu, tư vấn thông tin, thông tin dữ kiện 
được sử dụng để phục vụ chủ yếu cho những yêu cầu tin 
trong các lĩnh vực sản xuất, kinh doanh, nghiên cứu khoa 
học - công nghệ. quản lý hành chính. Để tìm kiếm thông tin 
dữ kiện việc đau tiên là xác định được các đối tượng cần 
tìm và các thuộc tính đối tượng phản ánh. 

Ví dụ: 

+ Các nguồn tài nguyêñ thiên nhiên 

+ Các chủng loại hàng hoá, sản phẩm công, nông, lâm, 
ngư nghiệp 

+ Tên các hãng, công ty: khả năng tài chính, lĩnh vực 
đầu tư, sản phẩm... 

+ Mẫu mã, nhãn hiệu hàng hoá.... 

Cũng như tra cứu thông tin tư liệu, tra cứu thông tin dữ 
kiện cũng phải dựa vào các yêu cầu tin (câu hỏi) cụ thể để 
lựa chọn nguồn tra cứu. Thông thường chúng ta hay gặp 5 
loại câu hồi cơ bản và cần xác định với câu hởi nào sẽ sử 
dụng loại tài liệu tra cứu nào cho phù hợp đó là: 
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- Cái gì? 

- A2 

- ở đâu? 

- Khi nào? 
- Tại sao? 


Có thể tham khảo ở trong bảng 5. 


Bảng 4 Các câu hỏi thường sử dụng 












. ý nghĩa của từ 

























Các từ . Cách phát ãm - Từ điển 
(Words) . Từ đồng nghĩa, - Từ điển từ chuẩn 
trái nghĩa (Thesauri) 


. Cách sử dụng 


. Khái niệm, kiến - Bách khoa thư 
thức (Background). 
. Sự kiện và con số | - Almanach 
(Facts and figures} - Sách tra cứu 


Tiểusử -Từ điển danh nhân 





Sự vật 
{Things) 




















AI? Nhân vật Background] - Bách khoa thư 
(Who?) Địa phương - Từ điển / danh nhân 
(People) Location địa phương 





Sự kiện cập nhật 
(Current events) 










- Bảng tra 








































Tại sao? | Thông tin | -— — [| ——— -—e— 
(Why?) (Informaiti - Từ điển , 
on) Sự kiện và con số __ | - Sách tra cứu, 


(Facts and figures} 


_———.——_mmmmm= 


- Niên giám thống kê 


———n—m=== 


- Bách khoa thự 






















Khái niệm, kiến 
thức (Backround]). 
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Câu hỏi 




















- Bản đồ 
-Tập bản đồ (Atlas) 
- Sách tra cứu địa lý 
. (gazetteer) 


Lãnh thổ: vùng, 
miền, tỉnh, thành 
phố (Location) 





ở đâu? 
(Wher?) 


Địa danh 
(Places) 





—=—ễ—m======re 


- Almanach 

- Sách tra cứu 
- Bách khoa thư 

- Bản đổ chuyên 
môn, bản đồ chuyên 
ngành 

- Từ điển địa danh 








Sự kiện và con số 
| (Facts and figures) 
Kiến thức - hiểu biết 
(Lịch sử và sự kiện ) 





















































Sự kiện và con số 
(Facts and figures) 
. Lịch sử 










. Sự kiện 
và ngày 
tháng 
(Events 
and 
dates 


- Almanach và niên 
giảm 

















Khái niệm, kiến ! - Bách khoa thư 


thức (Background). 


Bất cứ câu hỏi nào cũng phải biết phân tích vấn đề, trên 
cơ sở đó lựa chọn công cụ tra cứu phù hợp. 
Ví dụ: 
* Cho biết thời gian và diễn biến cuộc khởi nghĩa Thái 
nguyên? 
Với câu hỏi trên trả lời cho câu hỏi Kj¿ nào? 
Để làm rõ thời gian và diễn biến sự kiện, ta phải tìm ở 
Từ điển bách khoa Việt Nam, almanach, Niên giám,... 


176 





Ví dụ: Nguồn tìm: 

Tra: . Từ điển bách khoa Việt Nam. T.2: Vân K - Khởi 
nghĩa Thái nguyên: - 

. Biên niên sử. 

* Cho biết đỉnh Everet cao bao nhiêu mét? Ai là người 
đầu tiên chính phục nó? Trả lời câu hỏi Cái gì? Và A¡? 

Nguồn tìm: . Bách khoa thư (Các nước). 

. Từ điển bách khoa Việt Nam. 


Tra: .Từ điển bách khoa Việt Nam. T2. Vần E - 
Everest: Xem: Chômôlungma 


Chômôlungma cao: 8880 m. 
* Nhà văn L. Tolstoi mất năm nào? Trả lời câu hỏi A¡? 
Nguồn tìm: . Bách khoa thư (Các nước). 
. 4imanach. Những nên văn mình thế giới 
. Từ diển danh nhân thế giới,... 
* Tại sao Mỹ đánh Iraq (Lần thứ nhất)? 
Trả tời câu hỏi Tại sao? 
Nguồn tìm: . Bách khoa thư (Các nước). 
. Niên giám 
. Aimanach 
. Từ điển 
* Sông Đanip chảy qua những nước nào? 
Trả lời câu hỏi: Cái gì? 
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Nguồn tìm: . Bách khoa thư 
. Từ điển địa danh 
* Cho biết Nam Phi năm ở vĩ độ và kinh độ nào? 
Trả lời câu hỏi: ở đáu? 
Nguồn tìm: :.. Bách khoa thư, 
. Từ điển địa danh, 
. Sổ fay tra cứu địa danh, 
. Bản đô địa lý, 
. Tập bản đồ, 


3. MỘT SỐ VẤN ĐỀ CẦN LƯU Ý TRONG QUÁ 
TRÌNH TRA CỨU 


Với sự phát triển mạnh mẽ của khoa học và công nghệ 
trong những thập niên vừa qua, dẫn tới thông tin khoa học - 
công nghệ là một trong những nguồn tin rất chóng bị lỗi 
thời trong đó không loại trừ nhiều tài liệu tra cứu có liên 
quan. Vì vậy, khi sử dụng tài liệu tra cứu cần đánh glá Xem 
tài liệu cụ thể đó có còn phù hợp với yêu cầu tin hay 
không? Nghĩa là tài liệu có cung cấp thông tin cập nhật, 
đảm bảo độ tin cậy, đầy đủ?,.. 

Để kiểm tra vấn đẻ đó nên xem xét tới tmỘT SỐ yếu tố cụ 
thể có liên quan sau: 

~ Tác giả, 


- Mục đích xuất bản của tài liệu, 
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- Phạm vi bao quát đề tài, 

- Quan điểm, 

- Cách sắp xếp, 

- Chất lượng của các bảng tra, ` 

- Cách trình bẩy, 

- Tính cập nhật thông tin,... 

* Tác giả: 

Nhà xuất bản có danh tiếng có ý nghĩa quan trọng và có 

thể sử đụng như một tiêu chuẩn để đánh giá chất lượng của 

tài liệu. Lời tựa (mở đầu) thường liệt kẻ tên những người 
chủ biên, ban biên tập, cố vấn, cộng tác viên và cả trình độ, 
học hàm, học vị của họ,...Những thông tin chính xác đó có 
ý nghĩa và tác động đến yếu tố tác giả, dựa vào đó có thể so 
sánh lần xuất bản sau so với những lần trước; tài liệu của 
tác giá này với tác giả khác có cùng tên sách 

* Mục đích xuất bản: 

Đa phần tài liệu tra cứu trong phần mở đầu đều có phần 
giải thích mục đích (lí do) xuất bản tài liệu và đối tượng 
phục vụ của tài liệu, 

* Phạm vi: 

Khi cần tra cứu phải xem xét tài liệu có bao hàm lĩnh 
vực mình lựa chọn hay không? Có những nguồn tra cứu chỉ 
đành nêng cho các chuyên gia, còn một số khác dùng cho 
các đối tượng phổ thông. Tuy nhiên tác giả hay nhà xuất 
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bản có thể cũng cần thoả hiệp giữa sự uyên bác và đại 
chúng trong khi xuất bản, trên cơ sở đó định giá cả cho 
sách. 

* Quan điểm: 

Theo suy nghĩ của nhiều người, bất cứ tài liệu tra cứu 
nao của các quốc gia cũng có thể tra tìm và trả lời câu hỏi 
một cách chính xác, đầy đủ cho đúng đối tượng người dùng 
tin, tuy nhiên trong thực tế không ít tài liệu tra cứu mang 
quan điểm của một / một số quốc gia cụ thể - đó là nhu cầu 
thông tin tới mỗi quốc gia riêng và do đó nó có sự khác biệt 
với quan điểm của nhiều nước. Thông thường khi xem xét 
tài liệu tra cứu cần biết nó xuất bản ở đâu? Quan điểm của 
nước đó có ảnh hưởng tới thông tin mình cần tra cứu 
không? 

* Cách sắp xếp: 

Đa số người dùng tin muốn tra cứu thông tin nhanh 
chóng nên họ ưa thích nguồn tin đơn giản, để tham khảo, đa 
Số tài liệu tra cứu dễ sử dụng do cách sắp xếp khoa học. Tuy 
nhiên mỗi nguồn tra cứu có mục đích khác nhau nên có 
cách sắp xếp khác nhau. Ví dụ: Các bách khoa thư, từ điển 
ngôn ngữ, Từ điển nhân vật hay Từ điển thuật ngữ thường 
được sắp xếp theo hình thức: nghĩa là theo vần chữ cái của 
ngón ngữ tài liệu, còn các loại sách tra cứu chuyên ngành 
đa phần được sắp xếp theo nội dung chỉ tiết, cụ thể của 
chuyên ngành đó. 


* Chất lượng của các bảng tra. 
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Các bảng tra trong tài liệu tra cứu phải bao quát được nội 
dung phản ánh của tài liệu, giúp cho việc sử dụng ấn phẩm 
được dễ dàng và nhanh chóng. Nó có thể bao gồm các bảng 
chỉ dẫn / bảng tra cứu trực tiếp tới đối tượng cần tìm cũng 
như các bảng tra chéo, hoặc các chỉ chỗ:”Xem”, “Cũng xem 
",..Nó cũng có thể rất đơn giản chỉ có mục lục của tài liệu. 
Khi đánh giá cần xem xét cụ thể. 

* Cách trình bày của tài liệu: 

Khi xem xét một tài liệu tra cứu cụ thể, cần quan tâm tới 
đặc trưng loai sách, hình thức xuất bản, tranh ảnh, bản đồ, 
chất lượng giấy, màu sắc, dạng bìa sách, cách sắp xếp 
chúng.... Tất cả những yếu tố đó cũng sẽ ảnh hưởng tới chất 
lượng của tài liệu, nó giúp chúng ta quyết định lựa chọn 

.nguồn tra cứu này mà không chọn những nguồn tra cứu 
khác. Có tài liệu tra cứu được trang trí nhằm thu hút sự chú 
ý của người dùng tin: Màu sác, tranh ảnh, bản đồ và phông 
chữ đặc biệt,...những cái đó cũng quan trọng và góp phần 
làm tăng giá trị của tài Hệu, tuy nhiên nó không thể làm lạc 
hướng việc giới thiệu và đánh giá chuẩn xác thông tin cụ 
thể mà tài liệu đó phản ánh. 

* Tính cập nhật thông tin: 

Tính cập nhật thông tin là một yêú tố rất quan trọng của 
một ấn phẩm tra cứu. Nó được thể hiện trong Lời nói đầu / 
Lời giới thiệu. Thông thường khi tra cứu bao giờ người sử 
dụng cũng quan tâm tới những tài liệu mới xuất bản, song 
khi tra tìm cần phải lưu ý rằng năm xuất bản không phải 
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bao giờ cũng thể hiện tính cập nhật nội dưng thông tin vì có 
nguồn tra cứu lấy năm biên soạn là thời gian xuất bản tài 
liệu và nhiều ấn phẩm xuất bản kéo dài nhiều năm (có khi 
từ 5 - IŨ năm ), ví dụ như các loại Bách khoa thư: 
Encyclopedia Brianica. Grande Larouse. Encyclopedia 
Americana,...Đối với những loại tài liệu đó ngoài những tập 
chính cần quan tâm tới các niên giám (book of the V€ars) 
hay danh mục tra cứu ( supplementary lists, Index), chúng 
xuất bản định kỳ hàng năm, thông tin được thường xuyên 
bồ sung và cập nhật. 


Trong các nguồn tra cứu chủ yếu trên có một số nguồn 
tra cứu thông tin cũng rất chóng lỗi thời như: tài liệu tra cứu 
về các tổ chức - cơ quan, các loại niên giám thống kê, niên 
biểu, đặc biệt là sách tra cứu vẻ địa lí có một số lưu ý khi sử 
dụng: 

Tính chính xác của thông tin trong tài liệu tra cứu: Song 
song với thời gian xuất bản của tài liệu cộng với sự thay đổi 
về biên giới quốc gia, tên gọi và lãnh thổ của một số nước 
cũng góp phần làm cho thông tin không phải tài liệu nào 
cũng có khả năng cập nhật thường xuyên, 

Quan điểm thống nhất về tên địa danh: nó có thể là vấn 
đề chuyển mẫu chữ không phải chữ la tỉnh sang dạng khổ 
chữ khác (chữ ả rập. chữ tượng hình,...), đa số từ điển tuân 
thủ và công nhận theo chuẩn, tuy nhiên không ít từ điển 
không tuân thủ theo quy định (trong đó có một số từ điển 
xuất bản ở Việt Nam những năm 1960 - 1980) 
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Tính cân đói: Tập bản đồ thế giới của nhiều nước xuất 
bản đa phần tuân thủ tính cân đối về tỷ lệ, song có thể có 
những nước rất nhấn mạnh tầm quan trọng của nước mình 
và nó phá vỡ tính cân đối trong ấn phẩm. 
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CHƯƠNG 4 
TÌM TIN TIN TỰ ĐỘNG HOÁ 


Tìm tin bằng phương pháp truyền thống được tiến hành 
từ rất lâu trước khi có máy tính điện tứ. Sự ra đời của máy 
tính điện tử và ứng dụng chúng vào hoạt động thông tin thư 
viện từ đầu những năm 50 của thế kỷ XX đã dẫn đến sự 
xuất hiện của các cơ sở đữ liệu và ngân hàng đữ liệu. Ứng 
dựng máy tính điện tử đã tạo ra những bước phát triển mạnh ˆ 
mẽ trong các hoạt động thông tin thư viện, dẫn đến quá 
trình tin học hoá nhiều công đoạn của hoạt động thông tin 
thư viện. Nhờ ứng dụng máy tính điện tử, các chuyên gia đã 
sáng tạo ra những hệ thống tìm tin dựa trên cơ sở máy tính 
điện tử. Nhờ sự phát triển mạnh mẽ của công nghệ thông 
tin, những hệ thống tìm tin tự động hoá cũng ngày càng 
được phát triển và hoàn thiện. Tìm tin trong các hệ thống 
tìm tin tự động hoá đã trở nên một công việc phổ biến và 
bình thường tới mức trong nhiều tài liệu hiện đại thuật ngữ 
tìm tin (nformation retrieval) chủ yếu dùng để chỉ việc tìm 
tin có sử dụng máy tính điện tử, còn việc tra tìm thông tin 
theo phương pháp truyền thống dựa trên các công cụ truyền 
thông được gọi là công tắc tra cứu (reference WOFK). 


Với sự phát triển nhanh đến chóng mặt và ứng dụng rộng 
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rãi của công nghệ thông tin và viễn thông vào hoạt động 
thông tin thư viện, số lượng các cơ sở dữ liệu, ngân hàng đữ 
liệu, dịch vụ thông tin trực tuyến và các sản phẩm thông tin 
trên CD-ROM tang lên không ngừng 'tạo ra nguồn tin điện 
tử khổng lồ với những dạng thức da dạng, phong phú. Để 
khai thác hiệu quả nguồn tin nói trên đòi hỏi người tìm tin 
phải có những kiến thức và kỹ năng tìm tin tự động hoá. 
Trong phần này đề cập đến hệ thống tìm tìm tin tự động 
hoá, phương pháp tìm tin tự động hoá, quá trình và chiến 
lược tìm tin tự động hoá. 


1. DẠNG TÌM TIN TỰ ĐỘNG HOÁ 

Việc phân loại các dạng tìm tin tự động hoá có tính chất 
tương đối. Chúng ta có thể phân loại tìm tin tự động hoá 
dựa trên: : 

~- Nơi lưu giữ cơ sở đữ liệu; 

- Theo người thực hiện quá trình tìm. 

Dựa vào nơi lưu giữ cơ sở dữ liệu để truy cập, người ta 
có thể chia tìm tin tự động hoá thành các dạng: 

~ Tìm tin cục bộ 

- Tìm tin trực tuyến 

- Tìm tin trên CD-ROM 

Tìm tin cục bộ là quá trình tìm tin được thực hiện với cơ 
sở đữ liệu được lưu trữ ngay trên bộ nhớ của chính máy tính 
điện tử mà người tìm tin đang sử dụng. Tìm tin cục bộ cũng 
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có thể được gọi là tìm tin trên máy tính điện tử. Trong 
trường hợp này, phần mềm lưu trữ và tìm tin tương ứng 
được cài đặt cùng với cơ sở đữ liệu cục bộ. 

Tìm tin trực tuyến (thuật ngữ tiếng Anh là Øn-line 
lnformation Retrieval) là thuật ngữ chỉ việc tìm thông tin 
được lưu giữ trong cơ sở dữ liệu trên máy tính từ xa. Quá 
trình tìm tin được gọi là trực tuyến (on-line) được đặc trưng 
bởi việc truy cập đến các cơ sở đữ liệu từ xa và người tìm 
tin phải sử dụng mạng máy tính, mạng viễn thông, những 
phần mềm chuyên dụng. Tìm tin trực tuyến thường được 
thực hiện thông qua các tổ chức kinh doanh dịch vụ thông 
tin trực tuyến. 

Tìm tin trên CD-ROM là hoạt động tìm kiếm thông tin 
được tiến hành với các cơ sở dữ liệu lưu giữ trên CD-ROM. 
Nhờ sự phát triển của công nghệ sản xuất CD-ROM có khả 
năng lưu trữ lớn, nhiều nhà sản xuất cơ sở đữ liệu và các 
dịch vụ thông tin trực tuyến đã đưa nhiều loại cơ sở đữ liệu 
lên đa CD-ROM và phổ biến chúng tới người sử dụng trực 
tiếp. Những đĩa CD-ROM này có thể chứa phần mềm tìm 
tin chuyên dụng, cơ sở dữ liệu, tài liệu toàn văn. Với các cơ 
sở dữ liệu trên CD-ROM, người tìm tin không cần phải thực 
hiện tìm tin trực tuyến tới các cơ sở dữ liệu từ xa. Tìm tin 
trên CD-ROM đôi khi còn được gọi là tìm tin tại chỗ (on- 
Site information retrieval) bởi các cơ sở đữ liệu truy cập trực 
tuyến trước đây, do được đưa lên CD-ROM nên tìm kiếm 
được theo chế độ cục bộ. 
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Trong nhiều trường hợp, phần mềm tìm tin có thể được 
cài đặt vào ổ đĩa cứng còn cơ sở đữ liệu thì vẫn được lưu 
trên CD-ROM. Khi đó người ta truy cập chương trình tìm 
trên đĩa cứng. Trong trường hợp khác, một phần dữ liệu 
được cài đặt trên đĩa cứng của máy tính điện tử, một phần 
khác vẫn được lưu trên CD-ROM. Ví dụ bộ đĩa Thư viện 
điện tử TEL (IEEE/IEE Eiectronic Library) có chương trình 
tìm kiếm và cở sở dữ liệu được cài trên đĩa cỨng của máy 
tính trong khi dữ liệu phân toàn văn được đặt trên các đĩa 
CD-ROM. Do đó khi khai thác IEL phải sử dụng cả cơ sở 
dữ liệu trên đĩa cứng đồng thời sử dụng cả các đĩa CD- 
ROM chứa thông tín toàn văn, 

Tìm tin trên CD-ROM có thể được thực hiện theo hai 
phương thức: 

- tìm tin theo chế độ độc lập (stand-alone) 

- Tìm tin theo chế độ mạng. 


Việc tìm tin trên CD-ROM được tiến hành theo chế độ 
mạng khi các cơ sở dữ liệu trên CD-ROM được đưa lên 
mạng máy tính bằng các thiết bị đọc CD-ROM được nối 
mạng như tháp CD-ROM (CD Tower) hoặc hộp CD-ROM 
(Jukebox). 

Dựa vào người tìm tin, người ta có thể chia tìm tim tự 
động hoá thành: 

- Tm tím trực tiếp; 

~ Tìm tin gián tiếp. 
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2. CÚ PHÁP CỦA TÌM TIN TỰ ĐỘNG HOÁ 

Tìm tin tự động hoá gắn liền với hệ thống tìm tin tự động 
hoá. Cú pháp của tìm tin tự động hoá, cho dù đó là tìm tin 
trên hệ thống tìm tin trực tuyến hay trên CD-ROM hoặc 
trong cơ sở dữ liệu trên máy tính cá nhân, là tương tự như 
nhau. Việc nắm bắt được những nguyên tắc cơ bản khi xây 
dựng biểu thức tìm đảm bảo cho người tìm tin khai thác 
hiệu quả hệ thống. 

Trong tìm tin tự động hoá, chúng ta phải nắm vững 
những khái niệm hết sức quan trọng như biểu thức tìm. 
thuật ngữ tìm và các toán tử. Cú pháp tìm tin được sử dụng 
để tạo ra các biểu thức tìm (còn gọi là phương trình tìm) 
bằng các thuật ngữ tìm và việc kết hợp các thuật ngữ bằng 
những toán tử khác nhau. 

a_2.I Biểu thức tìm 

Trong tìm tin tự động hoá, một bước quan trọng là xây 
dựng một biểu thức tìm. Biểu thức tìm là một phương trình 
từm trong đó các thuật ngữ tìm tin được liên kết với nhau 
bằng các toán tử thể hiện các quan hệ giữa những thuật ng 
tìm do người tìm tin xác lập phù hợp với cú pháp của hệ 
thông. 

Biểu thức tìm có thể có các thành phần như thuật ngữ 
tìm, toán tử, các ký hiệu chật cụt, các dấu đóng ngoặc và 
mở ngoặc đơn, những ký hiệu tìm kiếm mở rộng hoặc hạn 
chế,.... 


Thuật ngữ tìm tin (scarch term) là từ, những từ. cụm từ, 
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con số được lựa chọn thể hiện yêu cầu tin. Thuật ngữ tìm tin 
có thể là một từ trong nhan đề, từ khoá, từ chuẩn, chỉ số 
phân loại, tên tác giả, tên nhà xuất bản, năm xuất bản. Ví 
dụ: 

Nguyên Tuân 

lúa 

nông nghiệp 

8701 

/990 

Thuật ngữ tìm tin không chỉ là từ, cụm từ, con số mà còn 

có thể là ký hiệu mà hệ thống tìm tin sử dụng để thể hiện. 
những biểu thức tìm đã thực hiện trước đó. Chẳng hạn 
chương trình CDS/ISIS sử đụng ký hiệu # và con số để thể 
hiện biểu thức tìm đã thực hiện (Ví dụ #2), còn chương 
trình DUALOG sử dụng ký tự Š và con số kèm theo (Ví dụ 
S3). Ví dụ về biểu thức tìm với thuật ngữ tìm có kết hợp 
biểu thức tìm trước đó (với CDS/ISIS): 


.. #2 * chụn giống 
trong đó: 
#2 là thể hiện biểu thức tìm số 2 


hoặc biểu thức tìm với chương trình tìm tìm của Dialog: 
Sĩ AND Computers 
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trong đó: 
S1 là thể hiện biểu thức tìm số j 
Nói tóm lại bất cứ một từ hay ký hiệu nào được nhập vào 
mà không phải những ký hiệu đã được hệ thống sử dụng 
làm toán tử, làm các ký hiệu mở Tộng/thu hẹp, toán hạng, so 


sánh điều có thể được hệ thống tìm tin hiểu là thuật ngữ 
tìm. 


Trong tìm tin tự động hoá, có thể phân biệt hai loại thuật 
ngữ tìm là: 

- Thuật ngữ chính xác 

- Thuật ngữ chặt cụt. 

Thuật ngữ chính xác (precise term) là phần tử tìm kiếm 
được xác định đối với hệ thống tìm tin. Ta phải hiểu và nắm 
chính xác các thuật ngữ này của hệ thống. Khi sử dụng 
thuật ngữ chính xác, hệ thống tìm tin sẽ thực hiện các phép 
so sánh chúng với những thuật ngữ đã được lưu trong tệp 
đảo hoặc tệp chỉ số của cơ sở dữ liệu. Những biểu ghi có 
chứa thuật ngữ trùng khớp với thuật ngữ tìm tin được chúng 
ta nhập vào biểu thức tìm sẽ được coi là phù hợp và sẽ được 
hệ thống chọn ra. Mọi sai khác, dù là nhỏ nhất, giữa thuật 
ngữ nhập vào biểu thức và thuật ngữ có trong tệp đảo đều 
coi là không trùng hợp. Kết quả là những biểu ghỉ chứa các 
thuật ngữ có sai khác sẽ không thể được hệ thống chọn ra. 
Ví dụ, nếu ta nhập thuật ngữ "hoá học" (dấu sắc ở chữ A) 
vào biểu thức tìm trong khi các biểu ghi trong cơ sở dữ liệu 
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lại được mô tả bằng thuật ngữ "hóa học" (dấu sắc ở chữ O) 
thì kết quả sẽ là không có biểu ghi phù hợp (không tìm ra) 
vì với hệ thống tìm tin "hoá học" khác "hóa học". 

Một loại hình thuật ngữ tìm tin đặc biệt gọi là thuật ngữ 
chặt cụt (/runcafed rerm) được nhiều hệ thống tìm tin sử 
dụng. Thuật ngữ chặt cụt là thuật ngữ tìm có chứa phần gốc 
của thuật ngữ và ký hiệu chặt cụt. 

Ví dụ với chương trình CDS/ISIS, thuật ngữ chặt cụt có 
thể như sau: 

. nông nghiệp$ 
lúa$ 
fish$ 

Trong những ví dụ trên, các cụm từ “nông nghiệp”, “lúa” 
hoặc "s#“ là phần gốc của thuật ngữ, còn ký hiệu ”$" là ký 
hiệu chặt cụt theo quy định của chương trình CDS/ISIS. Kỹ 
thuật tìm tin sử dụng thuật ngữ chặt cụt là kỹ thuật rất quan 
trọng và được sử dụng khá thường xuyên trong tìm tin tự 
động hoá (xem chỉ tiết phần phép tìm tin chặt cụt). 

a 2.2. Toán tử 

Biểu thức tìm tin có thể rất đơn giản chỉ gồm một từ, một 
cụm từ nhưng cũng có thể phức tạp với nhiều thuật ngữ tìm 
tin. Để kết hợp được các thuật ngữ tìm tin phải sử dụng 
những toán tử. Toán tử là những loại lệnh đặc biệt được hệ 
thống tìm tin quy định để thể hiện những quan hệ giữa các 
thuật ngữ tìm tin. Đại đa số các bệ thống tìm tin đều cho 
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phép xây dựng những biểu thức tìm phức tạp sử dụng các 
Loán tử. 

Đề tìm tin hiệu quả, người ta sử dụng và phối hợp những 
phương pháp khác nhau trong tạo lập biểu thức tìm. Trong 
tìm tin tự động hoá, người ta có thể áp dụng một số phương 
thức tìm tin như: 

- Sử dụng các toán tử boole 

- Sử dựng toán tử lân cận 

- Sử dụng phép tìm chặt cụt (truncation) 

- Sử dụng phép tìm giới hạn theo trường 

- Sử dụng phép tìm so sánh 

Người tìm tin có thể sử dụng một phương thức hoặc có 
thể phối hợp nhiều phương thức trong cùng một biểu thức 
tìm. Sau đây sẽ trình bày chỉ tiết những phương thức tao lập 
biểu thức tìm cơ bản. 

Jö 2.3. Sử dụng toán tử boole 

Trong biểu thức tìm, người ta có thể sử dụng một từ, một 
cụm từ làm thuật ngữ tìm tin. Tuy nhiên trong thực tế, với 
yêu cầu tìm tin phức tạp, không thể sử dụng một thuật ngữ 
duy nhất mà phải cần nhiều thuật ngữ tìm để thể hiện yêu 
cầu tìm tin nhằm đạt được kết quả đáp ứng được yêu cầu 
của người đùng tin. Trong trường hợp đó, người tìm tin sử 
dụng toán tử để thể hiện các quan hệ giữa những thuật ngữ 
tìm tin. Các toán tử boole chính là công cụ như vậy. 

Các toán tử boole (tiếng Anh là Boolean operators), 
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được đặt tên theo tên nhà toán học người Anh George Boole 
(1815-1864Ö. người đã đưa ra khái niệm toán tử khi thể hiện 
sự kết hợp các mệnh đề theo hình thức logic. George Boole 
đưa ra 3 toán tử là: 

- Toán tử giao (phép nhân, logical product). thường được 
ký hiệu là * hoặc AND; 

- Toán tử cộng logic (phép cộng, logic sum), thường 
được ký hiệu là + hoặc ÖR (hoặc); 

- Toán tử trừ logic (phép trừ, logical difference), thường 
được ký hiệu là - hoặc NOT. 

Những toán tử do G.Boole đề xuất thường được ký hiệu 
bằng ký hiệu toán tử AND, OR và NOT. Sau này, nhà toán 
học John Venn đã thể hiện những quan hệ logic của toán tử 
boole đưới dạng biểu đồ, thường được gọi là biểu đồ Venn. 

Toán tử Boole là dạng toán tử được sự dụng thường 
xuyên nhất trong quá trình tìm tin. Các toàn tử này cho 
phép thể hiện ba loại quan hệ cơ bản giữa các thuật ngữ 
trong biểu thức tìm: quan hệ giao, quan hệ hợp và quan hệ 
loại trừ. Thông thường, các hệ thống tìm tin tự động hoá sử 
dùng các ký hiệu AND. OR và NOT để thể hiện các toán tử 
boole. Tuy nhiên cũng có những hệ thống tìm tin sử dụng 
những ký hiệu khác cho các toán tử boole. Ví dụ chương 
trình CDS/ISIS sử dụng ký hiệu * (dấu sao) cho toán tử 
AND, đấu + (dấu cộng) cho toán tử OR, dấu ^ (đấu mũ) cho 
toán tử NOT. (Để giới thiệu chung, chúng ta sử dụng ký 
hiệu AND. OR và NOT). Khi áp dụng cho hệ thống cụ thể, 
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chúng ta phai tìm hiểu hệ thống và sử dụng ký hiệu do hệ 
thõng đưa ra. 

2.3.1. Toán tửứAND 

Toán tử AND tạo ra quan hệ giao và được sử dụng để thể 
hiện yêu cầu phải có sự xuất hiện đồng thời của những thuật 
ngữ hoặc khái niệm được dùng để định chỉ cho biểu ghi. 

Nếu viết biểu thức tìm có dạng tổng quái: 

A AND B 

trong đó A và B là hai thuật ngữ tìm, AND là toán tử, thì 
toán tử AND yêu cầu các biểu ghi trong tập hợp tìm được 
phải được định chỉ số đồng thời với hai thuật ngữ A và B. 
Các biểu ghi được định chỉ số là A và B sẽ là những biểu 
ghỉ phù hợp. Toán tử AND có tác dụng là chính xác hoá 
yêu cầu tìm kiếm, thu hẹp kết quả tìm tin. 

Ví dụ, nếu ta muốn tìm thông tin về "chọn giống lúa", 
chúng ta có thể tạo một biểu thức tìm có sử dụng toán tử 
AND nối 2 thuật ngữ tìm tin như sau: 


lúa AND chọn giống 


Những biểu ghi được định chỉ số là chọn giống và lúa sẽ 
là biểu ghi phù hợp. Như vậy tập hợp biểu ghi (tài liệu) thoả 
mãn yêu cầu tìm chính là giao của hai tập hợp: tập hợp biểu 
ghì thoả mãn yêu cầu có thuật ngữ “l2” và tập hợp thoả 
mãn yêu cầu có thuật ngữ "chọn giống”. 
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Biểu thức tìm sử dụng toán tử ANĐ như trên có thể được 
trình bày bằng biểu đồ Venn như trong hình 5. 





Hình 5. Biểu đô Venn về tác động của toán tử AND 


Trong hình 5 , vòng tròn bên phải là tập hợp những biểu 
ghi được định chỉ số với thuật ngữ "lúa", tập hợp bên trái là 
tập hợp những biểu ghi được định chỉ số với thuật ngữ 
"chọn giống” và phần giao nhau (tô đậm) là tập hợp những 
biểu ghi thoả mãn yêu cầu của biểu thức tìm. Đó là những 
biểu ghi được định chỉ số đồng thời với cả hai thuật ngữ 
Chọn giống và Lúa. 

2.3.2. Toán tứ OR 

Toán tử OR sẽ tạo ra quan hệ hợp và được sử dụng đề thể 
hiện yêu cầu rằng biểu ghi thoả mãn yêu cầu là biểu ghi chỉ 
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cản chứa một trong những thuật ngữ trong biếu thức tìm. 

Nếu viết biểu thức tìm có dang: 

AORB 

trong đó A và B là hai thuật ngữ tìm, OR là toán tư. thì 
toán tử ÔR sẽ tìm ra các biểu ghi định chỉ số với một trong 
hai thuật ngữ hoặc cả hai thuật A và B. Tất cả biểu ghi được 
định chỉ số với A hoặc B hoặc cả hai đều là phù hợp với yêu 
cầu tìm. 


Toán tử OR có tác buải mở rộng kết qủa tìm tin, nâng 
cao độ đầy đủ. 

VÍ dụ, nếu ta muốn tìm tài liệu về ngô hoặc lúa, ta có thể 
sử dụng toán tử QR để tạo ra biểu thức tìm như sau: 

ngỏ OR lúa 

Những biểu ghi được định chỉ số là "lứa" hoặc “ngậnt 
sẽ đều là biểu ghi phù hợp. Như vậy tập hợp biểu ghi (tài 
liệu) thoả mãn yêu cầu tìm chính là hợp của hai tập hợp: tập 
hợp biểu ghi thoả mãn yêu cầu có thuật ngữ “h¿¿” và tập 
hợp thoả mãn yêu cầu có thuật ngữ "neỏ”. 

Biểu thức Tác dụng của toán tử OR có thể được trình bày 
bằng sơ đồ Venn như hình 6.: 

Trong hình 6, vòng tròn bên phải là tập hợp biểu ghi 
được định chỉ số với thuật ngữ "ngô", vòng tròn bèn trái là 
tập hợp biểu ghi được định chỉ số với thuật ngữ "lúa". 
Toàn bộ phản tô đậm là tập hợp các biểu ghi thoả mãn yêu 
cầu của biểu thức tìm. Đó là những biểu ghỉ được định chỉ 
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số hoặc với thuật ngữ "⁄œ” hoặc với "wgó” hoặc với cả 
hai. 





Hình 6. Sơ đồ Vemn về tác động của toán tử OR 


2.3.3. Toán tử NƠT 

Toán tử NOT sẽ tạo ra quan hệ loại trừ và được sử dụng 
để yêu câu rằng biểu ghi tìm được phải là biểu ghi được 
định chỉ số bằng thuật ngữ ở phía trước toán tử và không 
được định chỉ số ở phía sau của toán tử. 

Nếu viết biểu thức tìm có dạng: 

A NOT B 

trong đó A và B là hai thuật ngữ tìm, NOT là toán tử, thì 
toán tử NOT sẽ tìm ra các biểu ghi định chỉ số với thuật ngữ 
A, nhưng không được định chỉ số với thuật ngữ B. 

Khác với hai trường hợp toán tử AND và OR, trong 
trường hợp sử dụng toán tử NÓI, thứ tự thuật ngữ trong 
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biểu thức tìm có ý nghĩa quan trọng. Kết quả của biểu thức 
tìm “A NOT B' sẽ khác "B NƠT A". 

Ví dụ, khi muốn tìm những tài liệu về chọn giống, nhưng 
không cần tài liệu về chọn giống ngô, người ta có thể viết 
biểu thức tìm tin có dạng: 

chọn giống NOT ngô 

Những biểu ghi được định chỉ số là ''chọn giống" nhưng 
không được định chỉ số là ”“wgó” sẽ là biểu ghi phù hợp. 
Như vậy tập hợp biểu ghi (tài liệu) thoả mãn yêu cầu tìm 
chính là hiệu của hai tập hợp: tập hợp biểu ghi thoả mãn 
yêu cầu có thuật ngữ “chọn giống” và tập hợp thoả mãn yêu ' 
cầu có thuật ngữ "ngó”. 

Tác dụng của toán tử NOT với biểu thức trên có thể được 
trình bày bằng sơ đồ Vemn như trong hình 7. 


Chọn 


giống 





Hình 7. Sơ đồ Vemn về tác động của toán tử NOT 
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Trong hình 7, vòng tròn bên trái là tập hợp biểu ghi được 
định chí số với thuật ngữ "chợn giống”, vòng tròn bên phải 
là tập hợp biểu ghi được định chỉ số với thuật ngữ "ngó". 
Toàn bộ phần tô đậm là tập hợp các biểu ghi thoả mãn yêu 
cầu trong biểu thức tìm. Đó là những biểu ghi được định chỉ 
số với thuật ngữ “chọn giống” nhưng không được định chỉ 
số với thuật ngữ *'=gó"”, 

Bằng việc phối hợp các toán tử trên đáy, ta có thể điễn 
đạt được một yêu cầu thông tin bất kỳ dưới dạng một biểu 
thức tìm. Ví dụ, nếu chúng ta có một yêu cầu thông tin là: 
"qnhíchị hãy tìm những tài liệu về chọn giống ngũ cốc, 
nhưng trừ lúa mỳ”, chúng ta có thể lập một biểu thức tìm có 
nhiều thuật ngữ và toán tử trên cơ sở phân tích yêu cầu đó 
thành các thuật ngữ rồi sử dụng các toán tử để kết hợp như 
Sau: 


chọn giống AND (ngũ cốc OR lúa OR ngô OR kẻ) 
NOT lúa mỳ 


Một đặc điểm cần chú ý là trong tất cả các hệ thống tìm 
tin tự động hoá, toán tử boole có tác động trên toàn bộ các 
trường của biểu ghi. Điều đó có nghĩa là những biểu ghi 
đáp ứng điều kiện của biểu thức tìm, những thuật ngữ có thể 
nằm trong các trường khác nhau của biểu ghi. 


Chẳng hạn ta có biểu thức tìm: 
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lứa AND chọn giống 


Thì nếu biểu ghi có chứa đồng thời hai thuật ngữ trên, 
nhưng thuật ngữ "/¿œ" có thể nằm trong nhan để, còn thuật 
ngữ “chọn giống" có thể nằm trong trường từ khoá hoặc từ 
chuẩn, thì biểu ghi vẫn được coi là thoả mãn điều kiện tìm 
và vấn được tìm ra. 

Để trình bày vẻ lý thuyết, người ta thường dùng lý hiệu 
AND, OR và NOT để chỉ 3 loại toán tử boole. Tuy nhiên, 
ký hiệu cho các toán tử boole trong các hệ thống tìm tin 
khác nhau có thể khác nhau. Ví dụ về ký hiệu toán tử boole 
của mội số chương trình được trình bày trong bảng 5. 


Bảng 5. Ký hiệu toán tử boote của một số chương 
trình tìm tin 















Loai toán tủ d trìnt/Hê thố 
oại toán tử Chương trình/Hệ thống 


CDS/ISIS [ DIALOG và STN 
Messenger 


AND 
OR 
NÓT 




















Sử dụng toán tử boole trong xây dựng biểu thức tìm tin là 
phương pháp cơ bản nhất và được áp dụng thường xuyên 
nhất. Tuy nhiên để tạo ra những biểu thức tìm đáp ứng được 
các yêu cầu tìm tín phức tạp còn cần thiết phải sử dụng cả 
những loại toán tử khác như toán tử lân cận, so sánh, ..... 
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a 2.4. Toán tử lân cận 

Hầu hết các hệ thống tìm tin tự động hoá còn cho phép 
sử dụng một số toán tử khác gọi là toán tử lân cận 
(proximity operators). Trong một số lài liệu, toán tử lân cận 
còn có thể được gọi là toán tử xấp xỉ. Toán tử lân cận là loại 
toán tử được sử dụng để thể hiện mức độ gần nhau (lân cận) 
của hai thuật ngữ được viết hai bên toán tử ở trong biểu ghi. 
Trong khi với toán tử boole, hai thuật ngữ có thể được nằm 
trong những vị trí rất xa nhau trong cùng một biểu ghi thì 
toán tử lân cận yêu cầu hai thuật ngữ cùng phải nằm ở 
những trường như nhau hoặc yêu cầu số từ nằm giữa hai 
thuật ngữ kẹp hai bên toán tử bàng hoặc không vượt quá 
một số lượng nhất định. 

Chẳng hạn nếu chúng ta muốn tìm tài liệu vẻ sử dụng 
năng lượng gió để sản xuất điện và xây dựng biểu thức tìm 
sử dụng toán tử boole như sau: 


năng lượng AND gió 


Thì kết quả tìm kiếm có thể đưa ra nhiều tài liệu không 
phù hợp yêu cầu vì toán tử AND có tác động trong toàn bộ 
biểu ghi, không đòi hỏi xác định vị trí tương đối giữu hai 
thuật ngữ nên có thể chúng ta sẽ tìm ra những biểu-ghi có 
chứa cả các thuật ngữ “năng lượng" và "gió” nhưng một 
thuật ngữ có thể nắm trong trường từ khoá, thuật ngữ kia 
nằm trong vùng nhan đề. Vì thế sẽ có những biểu ghi tìm ra 
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không phù hợp với yêu cầu tin (với câu hỏi trên. sẽ có thể 
tìm ra cả những biểu ghi nói về ảnh hưởng của gió đến an 
toàn đường dây điện,..). Để giải quyết tình trạng đó, chúng 
ta có thể sử dụng toán tử lân cận để yêu cầu hai thuật ngữ 
"nảng lượng” và "gió" phải đứng gần nhau để tạo ra cụm từ 
năng lượng gió” như vậy, chúng ta sẽ có kết quả tìm tin 
chính xác hơm. 

Toán tử lân cận có thể được xếp hai nhóm như sau: 

~- Toán tử mức câu 

- Toán tử mức trường. 

2.4.1. Toán tử lân cận mức câu 

Toán tử lân cận mức câu bắt buộc tập hợp biểu ghi thoả 
mãn yêu cầu phải là những biểu ghi có chứa hai thuật ngữ 
(tương tự như toán tử AND), nhưng hai thuật ngữ nằm hai 
bên của toán tử lân cận trong biểu thức tìm phải ở gần nhau 
(sát nhau) hoặc cách nhau một số từ nào đó trong một câu. 
Nói cách khác là nó quy định rằng giữa hai thuật ngữ ở hai 
bên toán tử lân cận có không nhiều hơn một số từ hoặc có 
chính xác một số từ nhất định. 

Ví dụ với chương trình CDS/ISIS, toán tử lân cận mức 
câu là toán tử . (dấu chấm) và $ (dấu đola). Toán tử . (dấu 
châm) yêu cầu hai thuật ngữ nằm hai bên của toán tử này 
phải ở vị trí xa nhau đúng hoặc không quá (n-]) từ, trong đó 
n là số toán tử dấu chấm được đặt giữa hai thuật ngữ. Ví dụ 
chúng ta dùng toán tử lân cận . (dấu chấm) của CDS/ISIS để 
tạo biểu thức tìm như sau: 
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chọn . giống 


thì trên thực tế ta yêu cầu chương trình CDS/ISIS tìm ra 
các biểu ghi có chứa cụm từ "chọn giống" vì giữa chọn và 
giống chỉ được cách nhau không quá 0 từ. 


Nếu ta có biểu thức tìm có 3 dấu chấm: 
hệ... tin 


thì những biểu ghi có chứa cụm từ "hệ thống thông tin", 
hệ thống tìm tin" đều được coi là thoả mãn điều kiện tìm. 


Một số hệ thống tìm tin tự động hoá có những toán tử 
lần cận còn đòi hỏi trình tự hai thuật ngữ trong biểu ghi 
phải đúng như thứ tự của thuật ngữ nêu trong biểu thức tìm. 
Chẳng hạn với hệ thống tìm tin trực tuyến DIALOG hoặc 
các chươn trình tìm tin trên CD-ROM của DIALOG Ơn 
DISC, toán tử lân cận (N) không quy định trật tự của hai 
thuật ngữ trong biểu ghỉ phải đúng như trong biểu thức, 
trong khi toán tử (W) lại yêu cầu trình tự của hai thuật ngữ 
trong biểu ghi phải đúng như trong biểu thức. Ví dụ, nếu 
với chương trình tìm tin của DIALOG, ta thực hiện hai lệnh 
tìm với hai biểu thức tìm: 
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information (N)technology (1) 
và 


information (W)technology (2) 


thì kết quả tìm sẽ khác nhau bởi với yêu cầu tìm thứ 
nhất, những biểu ghi có cụm từ "information technology” 
và "technology information” đều được coi là thoả mãn 
điều kiện tìm, trong khi với câu hỏi thứ hai, chỉ biểu ghi có 
chứa cụm từ "informaiion technology” mới được coi là 
phù hợp. : 

2.4.2. Toán tứ lân cận mức trường 

Loại toán tử lân cận mức trường yêu cầu biểu ghi tìm 
được phải chứa cả hai thuật ngữ nằm hai bên toán tử, đồng 
thời hai thuật ngữ đó phải ở cùng trong một trường hoặc 
một trường con, phụ thuộc vào loại toán tử. 

Những chương trình äm kiếm khác nhau có thể những 
loại toán tử lân cận khác nhau. Ví dụ về những dạng toán tử 
lân cận sử dụng trong chương trình CDS/ISIS và hệ thống 
tìm tin trực tuyến DIALOG và ý nghĩa của chúng được 
trình bày trong bảng 6 và 7. 

Một số hệ thống còn cung cấp cả loại toán tử lân cận 
dạng loại trừ (NOT PROXIMITY). Toán tử dạng (NOT 
PROXIMITY) yêu cầu hai thuật ngữ phải không được ở gần 
nhau hoặc trong cùng một trường. Hệ thống DLALOG cung 
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cấp toán tử lân cận dạng (NÓT W) và (NOT N). Ví dụ biểu 
thức tìm có thể viết như sau: 


ECONOMIC (NOT W) RECOVERY 
Bảng 6. Những toán tử lân cân của CDS/ISIS 


| Toeántử |  Vidụ _— | 


Solar . energy 
(dấu chấm) 










Yêu cầu hai thuật ngữ 

SOLAR và ENERGY phải ở 

sát nhau. 

Yêu cầu giữa hai thuật ngử 

SOLAR và ENEROYcó . 

không. quả (n-1) từ, trong đó 

n là số dấu chấm. 

Yêu cầu hai thuật ngữ 

SOLAR và ENERGY phải ở 

sát nhau. 

Yêu cầu giữa hai thuật ngữ 

SOLAR và ENERGY phải có 

đúng (n-1) từ (không nhiều 

1 hơn, không ít hơn), n là số 
ấu $. 































Solar... energy 






(nhiều dấu 
chấm} 





Soiar $ energy 




















nhiều dấu $ solar Š $$ energy 














| Yêu cầu hai thuật ngữ 
¡ SOLAR và ENERGY phải ở 
trong cùng một trường, Nếu 
có trường con phải trong 
cùng một trường con 

Nết: là trưởng lặp, phải trong 
củng một iần lặp. 


Yêu cầu hai thuật ngữ 
SOLAR và ENERGY phải ở 
| trong cùng một trường. Có 

thể ở trường con khác nhau 
hoặc lần lặp khác nhau 


solar(F}energy 















sa 1| 
lR (G) solar G)energy 

























Bảng 7. Toán tử lân cận của chương trình DIALOOG 


Yêu cầu hai thuật ngữ SOLAR và 
ENERGY phải ở sát nhau trong biểu 
ghỉ tìm được. Thuật ngữ SOLAR phải 
đứng trước ENERGY trong biểu nhi. 


solar(3W)energy | Yêu cầu hai thuật ngữ SOLAR và 
: ENERGY phải ở cách nhau không quá 
3 từ. Thuật ngữ SOLAR phải đứng 
trước ENERGY 


solar (N) energy Yêu cầu hai thuật ngữ SOLAR và 
ENERGY phải ở sát nhau. Hai thuật 


ngữ SOLAR và ENERGY có thể ở bất 
kỳ thứ tư nào trong biểu ghi. 


solar(3N}energy Yêu cầu hai thuật ngữ SOLAR và 
ENERGY ở cách nhau không quá 3 
từ. Hai thuật ngữ SOLAR và ENERGY 
có thể ở bất kỳ thứ tự nào 

solar (L) energy Yêu cầu hai thuật ngữ SOLAR và 
ENERGY phải cùng trong trường từ 
chuẩn của CSDL 

solar (S) energy Yêu cầu hai thuật ngữ SOLAR và 
ENERGY phải trong cùng một trường 
con của môi trường của CSDL 





nj 2.5. Sử dụng ký hiệu chặt cụt 

Phương pháp tìm tin bằng kỹ thuật chặt cụt (tiếng Anh là 
Truncation) là một kỹ thuật tìm tin khá phố biến và có ý 
nghĩa quan trọng trong tìm tin tự động hoá. Tìm tin dùng ký 
hiệu chặt cụt dựa trên khả năng của hệ thống tìm tin so sánh 
phần gốc của thuật ngữ tìm, từ đầu cho đến phần có dấu 
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chặt cụt với những thuật ngữ có trong tệp đảo của cơ sở dữ 
liệu. Khi thuật ngữ trong biểu thức tìm tin có ký hiệu chặt 
cụt, chúng ta sẽ có thuật ngữ chặt cụt và hệ thống sẽ thực 
hiện phép tìm tin theo kỹ thuật chặt cụt. Trong trường hợp 
đó, hệ thống tìm tin sẽ tìm những biểu ghỉ của cơ sở dữ liệu 
chứa những điểm truy cập có phần gốc từ trừng với phần 
thuật ngữ chặt cụt trong biểu thức tìm. 
VÍ dụ, nếu lập biểu thức tìm in với chương trình 
CDS/ISIS và sử dụng ký hiệu chặt cụt $ như sau: 
lúa$ 
Khi đó những biểu ghi có chứa các thuật ngữ tìm tin 
như: 
lúa 
- hứa chịu hạn 
lúa chịu úng 
lúa giống 
lúa lai 
la nếp 
la Hương 
lúa xuân 
đều được coi là thoả mãn yêu cầu tìm và đều được tìm ra. 
Ký hiệu chặt cụt có tác dụng mở rộng kết quả tìm, hỗ trợ 
tìm kiếm theo số ít và số nhiều. 
Đa số hệ thông hô trợ phép tìm sử dụng kỹ thuật chặt 
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cụt phía phải. Cũng có hệ thống còn hỗ trợ việc sử dụng ký 
hiệu chặt cụt ở bên trong từ và sử dụng làm ký tự đại diện, 
thay thế bất kỳ ký tự nào ở vị trí đó của từ. Ví dụ, trong hệ 
tìm tin trực tuyến DIALOG, người ta sử dụng dấu hỏi (2) 
làm ký hiệu chặt cụt. Nếu ta có biểu thức tìm: 
0rgani?ation 
thì những biểu ghi có chứa những thuật ngữ: 
organisation (theo tiếng Anh) 
organization (theo tiếng Mỹ) 
đều được coi là phù hợp. 
a 2.6. Tìm so sánh 
Phép tìm so sánh cho phép tìm theo các đấu hiệu định 
lượng. Tìm so sánh còn được gọi là tìm theo giá trị số 
(numeric searching) hoặc theo dãy (rangc scarching). Toán 
tử này được sử dụng trong nhiều hệ thống tìm tin. Nó được 
áp dụng để tìm theo giá trị số lượng hoặc dãy số. 
Ví dụ, khi sử dụng chương trình tìm tin CDS/ISIS, để tìm 
so sánh ta có thể tạo biểu thức tìm tin như sau: 


? val(v260) >-990 


trong đó: 

? thông báo sử dụng lệnh tìm so sánh 
val Hàm val, biến chuỗi ký tự thành số 
v260 Trường 260 (năm xuất bản) 
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G toán tử so sánh (lớn hơn hoặc bằng) 


Bảng....trình bày toán tử so sánh sử dụng trong Hệ thông 
DIALOG. 


Bảng. Toán tử tìm so sánh của DIALOG 

















SA= 1,000,000 
EM<500 
100<=EM<500 
SA>1,000,000 
PY>=1999 






















nhỏ hơn 
nhỏ hơn hoặc bằng 


lớn hơn 
lớn hơn hoặc bằng 


Q 2.7, Tìm giới hạn theo trường 




















Tìm giới bạn theo trường là một kỹ thuật có ý nghĩa khi 
chúng ta muốn đạt được độ chính xác cao hơn hoặc muốn 
hạn chế số lượng biểu ghi tìm được. 

Thông thường nếu không có những chỉ dẫn đặc biệt về 
tìm giới hạn theo trường thì hệ thống thực hiện tìm trong 
mọt trường có thể tìm được. Điều đó có nghĩa là thuật ngữ 
trong biểu thức tìm có thể thuộc bất cứ trường đữ liệu nào 
của biểu ghi. 

Để tìm giới hạn theo trường phải có những chỉ dẫn cụ 
thể, Những hệ thống khác nhau sẽ có những chỉ dẫn khác 
nhau. Trong một số hệ thống, người ta sử dụng tiền tố hoặc 
hậu tố hoặc toán hạng để thông báo tìm tin giới hạn theo 
trường. 
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2.7.1. Tiên tố 

Tiền tố mà mã được gán trước thuật ngữ tìm tin để thông 
báo tìm hạn chế theo trường. Chảng hạn, trong hệ 
DIALOG, sử dụng một số tiền tố như AU=, TÍ=, PY=,... 

Ví dụ, những biểu thức tìm đưới đây có ý nghĩa như sau: 
Biển thức tìm ý nghĩa 


AU-=Smith? Tìm các tác giả có hợ là SMITH 

TI=energy Tìm các biểu ghi, trongnhan để có 
chứa thuật ngữ ENEROY 

PY=1999 Tìm biểu ghi có năm xuất bản là 1999 


7.7.2. Hạn tố 

Hậu tố là mã gán sau thuật ngữ tìm tin để thông báo tìm 
giới hạn theo trường. Ví dụ sử dụng hậu tổ trong hệ 
DIALOG trình bày dưới dây: 


Biểu thức fìm ý nghĩa 
Smith?INAU Tìm các tác giả có hợ là SMITH 


energy IN TI Tìm các biểu ghi, trongnhan để có chứa 
thuật ngữ ENEROGY 
1999 IN PY Tìm biểu ghi có năm xuất bản là 1999 


Trong chương trình CDS/ISIS, người ta sử dụng toán 
hạng có công thức 
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/q—D) 
lam hậu tố, trong đó ID là dấu nhận biết trường do tệp 
Bảng chọn trường (FST) quy định. Ví dụ, nếu trường tác giả 
được xác định trong tệp FST có dấu nhận biết trường (ID) là 
210, thì lệnh tìm tác giả Nguyên Văn Hiệu, giới hạn trong 
trường tác giả có thể có công thức như sau: 


Nguyễn Văn Hiệu/(210) 


n 2.8. Trình tự xử lý và thay đổi mức ưu tiên 

Khi trong một biểu thức tìm tin có nhiều loại toán tử 
khác nhau thì các hệ thống tìm tin xử lý theo thứ tự mức ưu 
tiên giữa các toán tử đó. 

Quy tắc chung của mức ưu tiên của các toán tử thông 
thường như sau: 

- Toán tử lân cận có mức ưu tiên cao hơn toán tử boole 
và được xử lý trước. Toán tử lân cận mức câu thường được 
ưu tiên hơn mức trường. 

- Toán tử AND và NOT được ưu tiên hơn toán tử OR 

- Khi có các toán tử ngang nhau về mức ưu tiên, hệ 
thống sẽ xử lý từ trái sang phải. 

Ví dụ, mức độ ưu tiên của các toán tử trong CDS/ISIS và 
DIALOG như sau: 
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Mức ưu tiên Toán Iư của Toán tứ của DĨIALOG 


CSD/ISIS 
Cao nhất . và $ (W), (N), (L), (S) 
(F) và (G) NỌT 
* và 4 AND 
tháp nhát + OR 


a 2.9. Sử dụng dâu đóngmở ngoặc đơn 

Đấu đóng mở ngoặc đơn có tác dụng nhóm các thuật ngữ 
để thay đối thứ tự ưu tiên thực hiện toán tử trong biểu thức. 
Việc sử dụng dấu ngoặc đơn cho phép tạo ra những biểu 
thức tìm tin phức tạp. Nguyên tác cơ bản của các hệ thống 
tìm tin là xử lý những kết hợp có ưu tiên cao nhất trước, ưu 
tiên thấp sau và Irong ngoặc trước, ngoài ngoặc sau (tương 
tự như phép tính số học theo nguyên tắc nhân, chia trước, 
Cộng trừ sau, trong ngoặc trước, ngoài ngoặc sau). Nếu bên 
trong ngoặc có các toán tử với mức ưu tiên khác nhau thì sẽ 
thực hiện theo thứ tự ưu tiên chung. Để đảm bảo cú pháp 
của hệ thông, số lượng ngoặc mở phải cân bằng với ngoặc 
đóng. 

VÍ dụ nếu có biểu thức tìm tin cho cơ sở dữ liệu 
CDS/ISIS như sau: 

(A+B)*(C +D*E) 

Trình tự xử lý của chương trình sẽ như sau: 

#l Đ*E 

#2 A+B 


13 
1-2 





#3  C+ kết quả của bước l 

#4. Kết quả bước 2 * kết quả bước 3 

Nhiều hệ thống cho phép sử dụng nhiều cấp đóng/mở 
ngoặc. Biểu thức tìm kiểu đó gọi là biểu thức tìm lồng ghép 
(nesied expresston). 


3. NGÔN NGỮ LỆNH TRONG TÌM TIN TỰ ĐỘNG 
HOÁ 

Để tìm tin trong những hệ thống tìm tin tự động hoá, 
người tìm tin phải biết sử dụng các lệnh tìm của hệ thống. 
Ngôn ngữ lệnh của hệ thống tìm tin là một dạng ngôn ngữ 
hình thức hoá, có cú pháp và vốn từ vựng riêng, có cấu trúc 
và ngữ nghĩa riêng. Mỗi hệ thống tìm tin khác nhau có thể 
có hệ thống lệnh khác nhau. Người ta tổng kết là có một số 
hệ thống lệnh tìm tin như sau: 

- Hệ thống dòng lệnh 

- Hệ thống thực đơn 

- Hệ thống hỗn hợp 

- Hệ thống tựa web 

a 3.1. Hệ thống dòng lệnh 

Hệ thống dòng lệnh là hệ thống lệnh tìm tin phát triển 
đầu tiên. Hệ thống tìm tin theo dòng lệnh được sử dụng cho 
các hệ thống tìm tin thế hệ đầu tiên. Mọi giao tiếp giữa 
người sử dụng và hệ thống được thực hiện thông qua ngôn 
ngữ lệnh của hệ thống. Ngôn ngữ lệnh của hệ thống tìm tin 
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có vốn từ vựng không nhiều, hạn chế. Các lệnh được thể 
hiện bảng những từ hoặc chữ cái nhất định. h 
Ví dụ, hệ thống tìm tin trực tuyến DỊALOG sử dụng từ 
_BEGIN" hoặc chữ B để chọn cơ sở dữ liệu. Danh mục một 
số lệnh của DIALOG được trình bày trong bảng 8. 
Bảng 8. Một số lệnh của hệ thông DIALOG 














Lệnh 
BEGIN hoặc B 


Thí dụ và ý nghĩa 





BEGIN 208 
B208 
(Chọn cơ sở dữ liệu 208 - mã số này tương ứng 
với cơ sở dữ liệu (file} số 20B trong danh mục cơ 
sở dữ liệu của ngân hàng dữ liệu DIALOG 
SELECT information technology 

S information technology 

(Tìm tin với biểu thức information technoloay) 
SELECT S1 AND energy 

S S1 AND energy 

{Tìm tin với biểu thức kết hợp giữa lệnh tìm số 1 


















SELECT hoặc S 

























ũ 
EXPAND enargy 
E energy 
!_(Xem từ điển thuật ngữ, bắt đầu với từ enero 
DISPLAY S1 


EXPAND hoặc E 















DISPLAY hoặc D 





t quả của lệnh 1im số 1) 








TYPE hoặc T 







(Xem kết quả của lệnh tìm số 1) _ 
PRINT S1 

PS1 

In kết quả của lệnh tìm số 1 











PRINT hoặc P 
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Dòng lệnh có ưu điểm là cung cấp độ linh hoạt cao trong 
việc xây dựng biểu thức tìm; có khả năng tạo ra những biểu 
thức tìm linh hoại, phức tạp, chính xác. Tuy nhiên nhược 
điểm cơ bản của dòng lệnh là đòi hỏi người sử dụng phải 
nhớ (thuộc lòng) các lệnh của hệ thống, phải có nhiều kinh 
nghiệm và cần được đào tạo cẩn thận. 

a 3.2. Hệ thống thực đơn 

Hệ thống thực đơn (Menu) được phát triển sau hệ thống 
dòng lệnh. Trong hệ thống thực đơn, người sử dụng được 
yêu cầu lựa chọn các phương án mà hệ thống giới thiệu. Hệ 
thống thực đơn thường được thiết kế theo cấu trúc thứ bậc 
(hoặc hình cây). Mức cao nhất khi khởi tạo chương trình 
tìm được gọi là thực đơn chính (Main Menu). Ví dụ, khi 
khởi động chương trình khai thác cở sở dữ liệu của 
DIALOG Ởndisk.exe, chúng ta sẽ thấy thực đơn chính như 


sau: 


Select Search Mode 


Easy Menu Search 







Dialog Contrand Search 





Online Search 


Setup and Accounting 
Exit to DOS 
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Tại thực đơn chính, người sử dụng sẽ được chỉ dẫn đến 
thực đơn cấp thấp hơn. Để chọn thực đơn tiếp sau, người ta 
dùng phím con trỏ đưa đến thực đơn cần chọn rồi bấm 
"ENTER" để chọn. Người ta có thể chọn thực đơn bằng 
cách bấm các phím đại diện (ví dụ với chương trình 
CDS/ISIS, chọn phím S tại thực đơn chính để vào menu tìm 
tin). 





s: CDS/ESIB or Windows |ftÍ Yerston : EH] 
Hiahesk Drovwse Seành Edit GpnlQque HE Windows Heip 


li |S/=] [ojael 


tì c \w#inrrisXdatadetairXdeLai mạt 
















: 12A I2 09 

Tình trang đề tău: Đã kết thúc 

Số đăng ký Để tài: 86-12-240/ÐT 

Lom hnhNC :TRTN 

Linh vự khoa học: KT-CN . 

Tên để tài : Nghiên cứu khảo sát đánh giá thực trang hiên nay của nhà máy 
tuyển than 2 Cửa ông. Xác ‹định giải pháp kỹ thuật nhằm 
từng bước ổn định công nghệ tuyển huyện phù về đãi 
lắng của nhà máy 

Chủ nhiệm để tài : Caa Đăng Lộc 

K5, 


Cơ quan chủ trì : Viên HC KHKT Mö 


Cơ quan chủ quản : Bỏ Năng lượng - _j i 


Hình 8. Thực đơn chính của chương trình Winisis 





Ưu điểm cơ bản của hệ thống thực đơn là đơn giản, đễ sử 
dụng, không đòi hỏi phải đào tạo làu. Tuy nhiên nhược 
điểm của nó là độ linh hoạt để tìm tin bị giảm hơn so với 
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dòng lệnh; mức lựa chọn bị hạn chế trong các lựa chọn đã 
cung cấp; có thể bị lân thực đơn. 

Hệ thống thực đơn được phát triển mạnh trong những 
năm 90 của thế kỷ trước. Đặc biệt với sự phát triển của các 
ứng dụng trên nên hệ điểu hành Windows, hầu hết các 
chương trình tìm tin đều được phát triển để chạy trên 
Windows và hỗ trợ phương thức thực đơn. Thí dụ về thực 
đơn chính của chương trình Winisis for Windows (thường 
gọi là Winisis) được trình bày trong hình 8. 

na 3.3. Hệ thống hôn hợp 

Hệ thống hỗn hợp là hệ thống ngôn ngữ lệnh có cả thực 
đơn và có cả dòng lệnh. Người ta có thể chọn một trong hai 
phương án. 

na 3.4..Hệ thông tựa Web 

Với sự phát triển của Internet và trình duyệt web, ngày 
càng có nhiều cơ sở đữ liệu được khai thác thông qua Wortd 
Wide Web. Những hệ thống này được gọi là hệ thống tựa 
Wcb (Web-based), sử dụng trình duyệt Web (như Internet 
Explorer hoặc Nescape Navigator) để làm giao diện tìm 
kiếm. Với giao diện Web, người tìm tin sử dụng chuột hoặc 
các thanh cuốn (scrolling bar} để chọn các chức năng theo 
yêu cầu. Biểu thức tìm trn được nhập vào các biểu mẫu 
được thiết kế sẵn. Nhiều yếu tố tìm kiếm hoặc các toán tử 
có thể được lựa chọn bằng các nút chọn hoặc bằng kích 
chuột vào ô đánh dấu. 

Nhiều cơ sở dữ liệu trên CDROM cũng được thiết kế để 
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có thể sử dụng trình duyệt Web làm giao điện tìm kiếm 
trong CSDL. Thí dụ thư viện điện tử IEL, của Viện Kỹ sư 
điện/điện tử quốc tế (TEE/IEEE Electronic Library) sử dụng 
chương trình tìm tin với sự trợ giúp của trình duyệt Web. 

Các dịch vụ thông tin trực tuyến cũng chuyến đổi các 
chương trình tra cứu cũ sang dạng tựa Web. Ví đụ, Hãng 
DIALOG, ngoài chương trình tìm tin bằng đồng lệnh thông 
qua Internet (gọi là Dialogclassic Web) còn có chương 
trình tìm tín tựa Web (Dialog Web). Mạng thông tin quốc tế 
STN xây dựng chương trình tìm kiếm gọi là STN Easy với 
giao diện Web để giúp người dùng tin khai thác nhân hàng 
dữ liệu của mình (Chương trình tim tin truyền thống của 
STN được đặt tên là Messenger và;sử dụng dòng lệnh). 

Ưu điểm của hệ thống tựa Web là rất dễ sử dụng bởi 
những chức năng chung như in, lưu kết quả... được dựa vào 
các công cụ của trình duyệt Web (ví dụ như Intemet 
Explorer, Netscape Navipator,...). Những trình duyệt này 
ngày nay đã trở nên rất quen thuộc với người sử dụng, 
không mất thời gian tìm hiểu, đào tạo sử dụng. 


4. NHỮNG BƯỚC TÌM TIN TỰ ĐỘNG HOÁ CƠ BẢN 
Những kiến thức cơ bản vẻ quá trình tìm tin đã được 
trình bày ở phần trên. Trong phần này, chúng tôi chỉ trình 
bày những vấn đề liên quan trực tiếp đến quá trình tìm tin tự 
động chưa được trình bày chỉ tiết ở phần trên như phân tích 


218 





khái niệm, xây dựng biểu thức tìm, chiến lược tìm tin, hiệu 
chính lệnh tìm..... 

Quá trình tìm tin tự động hoá, dù đó là quá trình có hoặc 
không có chuyên gia tìm tin trung gian có thể được chia 
thành nhiều bước theo một trình tự hợp lý. Tìm tin tự động 
hoá là một quá trình truyền thông giữa người có nhu cầu 
tìm tin và hệ thống tìm tin. Quá trình tìm tin tự động hoá ở 
những loại hình tìm tin khác nhau có thể khác nhau. Quá 
trình tìm tin gián tiếp thông qua chuyên gia tìm tin cũng 
không giống với quá trình tìm tin của người dùng tin trực 
tiếp. Quá trình tìm tin trên những hệ thống cục bộ, CD- 
ROM có thể khác với quá trình tìm tin trực tuyến. 

Quá trình tìm tin bao giờ cũng bát đầu bằng một câu hỏi 
của người có nhu cầu tin. Trong nhiều trường hợp, người 
dùng tin có thể không thể hiện đúng nhu cầu tin của mình 
trong câu hỏi gửi tới người tìm tin. Người chuyên gia tìm 
tin phải tiếp xúc với người dùng tin để làm rõ nhu cầu thông 
qua quá trình được gọi là phỏng vấn tham khảo (reference 
interview). Trong quá trình phỏng vấn tham khảo. phải xác 
định rõ mục tiêu mà người dùng tin muốn đạt được. Mục 
tiêu tìm tin của người dùng tin có chia thành ba dạng: 

-- Đạt độ đầy đủ cao về thông tin tìm kiếm: tìm được 
càng nhiều càng tốt thông tin về chủ đẻ quan tâm; 

- Đạt độ chính xác cao về thông tin tìm kiếm: tìm được 
những thông tin trùng hợp nhất với chủ đề quan ôm: 
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_- Đạt được sự chọn lọc cao về thông tin: tìm được những 
bài theo đúng mẫu đã chọn . 

Việc xác định đúng yêu cầu tin, mục tiêu tìm kiếm, sẽ 
giúp cho việc xác định chiến lược tìm phù hợp, thoả mãn 
cao nhất được nhu cầu tin của người dùng tin. 

Khi đã xác định được yêu cầu cụ thể của người dùng tin, 
người cán bộ tìm tin phải xác định xem cần tiến hành tìm 
tin trong hệ thống nào. Ngày nay có rất nhiều hệ thống tìm 
tin tự động hoá, nhiều cơ sở đữ liệu, dịch vụ trực tuyến, cơ 
sở dữ liệu trên Internet... có thể cung cấp thông tin. Vì vậy 
cần phải xác định để lựa chọn chính xác nơi cần truy cập và 
thực hiện lệnh tìm. Quyết định lựa chọn cơ sở đữ liệu có vai 
trò quan trọng vì nó đảm bảo một phần quan trọng trong 
việc đáp ứng yêu cầu tin. Việc lựa chọn cơ sở dữ liệu phải 
dựa vào một số tiêu chí như: diện bao quát đề tài, số lượng 
nguồn tin được xử lý (số đầu tên tạp chí), mức độ hỏi cố, 
múc độ chọn lọc, mức độ xử lý, giá cả truy nhập,... Quyết 
định lựa chọn cơ sở dữ liệu thường là của người chuyên gia 
tìm tin bởi họ là người có hiểu biết hơn về ngân hàng dữ 
liệu. Người có nhu cầu tin cũng có vai trò nhất định trong 
việc lựa chọn cơ sở dữ liệu. Họ có thể gợi ý cơ sở dữ liệu 
tìm kiếm khi họ đã từng sử dụng cơ sở dữ liệu đó. 

n 4.1 Xác định các khái niệm và thuật ngữ tìm 

Yêu cầu tìm tin của người dùng tin được thể hiện bằng 
ngôn ngữ tự nhiên. Yêu cầu đó phải được chuyên gia tìm tin 
nghiên cứu kỹ càng, phân tích để từ đó rút ra những khái 
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niệm. đối tượng hoặc chủ đề chính của yêu cầu tin. Công 
đoạn này được coi là việc dịch yêu cầu tin từ ngôn ngữ tự 
nhiên (ngôn ngữ của người có yêu cầu tin) sang ngôn ngữ 
tìm tin của hệ thống. Trong hoạt động tìm tin có sự tham 
gia của người cán bộ tìm tin chuyên nghiệp, người chuyẻn 
gia tìm tin là người phân tích khái niệm, dịch các khái niệm 
sang ngôn ngữ tìm tun của hệ thống và xác định quan hệ 
giữa những khái niệm đó. Quan hệ này có thể là quan hệ 
tương giao (phép Và), quan hệ hợp (phép Hoạc), quan hệ 
loạt trừ (phép Trừ). 

Những khái niệm đã được rút ra sau khi phân tích yêu 
cầu tìm tin sẽ được dịch sang thuật ngữ tìm tin sử dụng các 
công cụ ngôn ngữ tìm tin như: từ điển từ chuẩn, để mục chủ 
đẻ, bộ từ khoá có kiểm soát, bảng phân loại..... Nhằm khắc 
phục sự lạc hậu của các ngôn ngữ tìm tin, người ta có thể sử 
dụng từ khoá tự do để thể hiện các khái niệm. 

Ví dụ, chúng ta có yêu cầu tin: “Tỏi mHốn tìm một số 
thông tin để nghiên cứu có những giống lúa phù hợp cho 
vàng cao, í nước tưới, khó han”. Việc nghiên cứu. phân 
tích nhu cầu tin cho phép chúng ta có thể rút ra ba khái 
niệm (chủ để của yêu cầu là: "lứa", "khô hạn” và 
"uiống", Với những khái niệm trên. chúng ta có thể lập 
một bảng gồm 3 khối, mỗi khối là tập hợp những thuật ngữ 
tương đương thể hiện khái niệm (xem bảng 9). 


Bảng 9. Phân tích yêu cầu tin thành khái niệm 


Khái niệm 2 
GIỐNG 

lúa, lúa nước, lúa | hạn, chịu hạn, chọn giống, chọn 
nương, oryzZa sativa | khô, vùng lọc, tạo giống 


























Chúng ta có thể xác định quan hệ giữa các thuật ngữ 
theo công thức đơn giản sau: 

- Quan hệ giữa các khối khái niệm là quan hệ giao, yêu 
cầu sử dụng toán tử AND, 

- Quan hệ giữa các thuật ngữ trong cùng một cột là quan 
hệ hợp, yêu cầu sử dụng toán tử OR. 

n 4.2. Lựa chọn chiến lược tìm tin 

Chiến lược tìm tin có thể được hiểu là một kế hoạch tìm 
được vạch ra nhằm đạt được mục tiêu tìm kiếm đã được xác 
định thông qua phân tích nhu cầu tin và mục tiêu tìm tin. 

Người chuyên gia tìm tin cần chuẩn bị phương án thay 
thế khi lệnh tìm được chuẩn bị không cho kết quả như 
mong đợi. Họ phải chuẩn bị các thuật ngữ thay thế trong 
trường hợp thuật ngữ được lựa chọn tỏ ra không phù hợp. 

Trước khi tìm tin, người cán bộ tìm tin cần xác định rõ 
các trường có thể giới hạn yêu cầu tìm. Thông thường 
những hệ thống tìm tin tự động cho phép thực hiện tìm 
kiếm trong toàn bộ biểu ghi. Tuy nhiên, để nâng cao chất 
lượng tìm kiếm hoặc tăng độ chính xác hoặc đảm bảo tính 
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đặc thù của mục tiêu tìm tin như xác định trong bước 2, 
người ta có thể phải thực hiện tìm giới hạn trong một trường 
nhất định như tìm trong nhan đẻ, theo tác giả, theo ngõn 
ngữ, năm xuất bản, từ chuẩn,... 

Căn cứ mục tiêu tìm kiếm, người ta để xuất những chiến 
lược tìm tin tự động hoá khác nhau. Một số chiến lược cơ 
bản trong tìm tin tự động hoá bao gồm: 

- Chiến lược tìm ngắn gọn 

- Chiến lược khối xây dựng; 

- Chiến lược thu hẹp dần dần; 

- Chiến lược mở rộng dần dần. 

a 4.3. Xáy dựng biểu thức tìm 

Xây dựng biểu thức tìm là một bước hết sức quan trọng. 
Sau khi đã chuẩn bị kỹ càng các bước trên, người chuyên 
gia tìm tin sẽ xây dựng một yêu cầu tìm hình thức hoá bằng 
những thuật ngữ tìm được lựa chọn, sử dụng các toán tử thể 
hiện quan hệ giữa các thuật ngữ đó. 

Trong quá trình tìm tin, có thể xẩy ra nhiều tình huống 
bất ngờ như câu hỏi đặt ra đưa ra quá nhiều kết quả hoặc 
đưa ra quá ít kết quả, thậm chí không có biểu ghi như mong 
muốn. Vì thế để đảm bảo cuộc tìm có khả năng thành công 
cao, người chuyên gia tìm tin cần chuẩn bị sẵn một vài 
phương án dự phòng như chuẩn bị sẵn các thuật ngữ khác 
nhau, chuẩn bị phương án thu hẹp khi kết quả tìm ra quá 
nhiều,V.V... 
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Sau khi đã chuẩn bị kỹ càng các phương án, người tìm 
tin truy cập hệ thống và thực hiện lệnh tìm tin theo biểu 
thức tìm và chiến lược tìm đã vạch ra. Người cán bộ tìm tin 
cần nắm vững các lệnh của hệ thống, nhập chính xác các 
lệnh tìm đã chuẩn bị vào hệ thống. 

n 4.4. Đánh giá sơ bộ và hiệu chỉnh kết quả tìm kiếm 

Khi thực hiện lệnh tìm xong, người cán bộ tìm tin cần 
xem nhanh một số biểu ghi đầu tiên để đánh giá nhanh xem 
lệnh tìm của mình chuẩn bị có đạt yêu cầu không. 

Phương pháp đánh giá có thể như sau: 

- Đọc nhanh nhan đẻ 

- Đọc lướt tóm tát 

- Đọc nhanh trường từ khoá/từ chuẩn 

Trong quá trình đọc đó, người tìm tin cần so sánh kết 
quả thu được với những kết luận đã rút ra từ bước tìm hiểu 
nhu cầu tin. 

Nếu kết quả tìm kiếm là phù hợp với yêu cầu tin thì tiếp 
thực hiện các bước tìm kiếm, lưu, tải kết quả về, ¡n.... 

Tìm tin tự động hoá là quá trình tìm tin tương tác. Khi 
đánh giá kết quả trung gian, người cán bộ tìm tin sẽ quyết 
định tiếp tục thực hiện những bước tiếp theo của lệnh tìm 
hoặc hiệu chính bằng cách lặp lại những bước trước đó của 
quá trình tìm tin. Tuỳ theo tình hình cụ thể, việc xem xét lại 
có thể từ đầu đến chuẩn bị biểu thức tìm. 

Khi xem xét kết quả của lệnh tìm, chuyên gia tìm tín có 
thể đưa ra những giải pháp để xử lý tình huống nếu lệnh tìm 
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ban đầu không đưa ra kết quả như dự kiến. Có thể có một số 
tình huống như sau: 

4.5.1. Lệnh tìm ban đầu cho ra quá nhiều biểu ghi. 

Nguyên nhân của tình trạng này có thể khác nhau. 
Chẳng hạn do người tìm tin đã sử dụng nhiều từ đồng nghĩa 
để đảm bảo độ đầy đủ, hoặc sử dụng ít khái niệm để mô tả 
yêu cầu tin. Để xử lý tình huống này, người tìm tin có thể 
áp dụng một số phương pháp như sau: 

- Đưa thêm những khái niệm mới và dùng toán tử AND 
để thu hẹp kết quả bar: đầu : 

- Sử dụng từ chuẩn hoặc từ khoá được chọn ra từ những 
biểu ghi phù hợp nhất để tăng độ chính xác 

- Nếu dùng nhiều từ đồng nghĩa thì loại bỏ bớt một số từ 
đông nghĩa không quan trọng trong lệnh tìm tin, 

- Áp dụng phương pháp tìm hạn chế trong một số trường 
(Ví dụ trong trường từ khoá, trường nhan đề,..). 

4.5.2. Nếu lệnh tìm đưa ra kết quả có quá ít biểu ghỉ 

Nguyên nhân có thể do ta dùng các từ khoá quá chuyên 
sâu, không thông dụng hoặc sử dụng nhiều khái niệm nhằm 
đạt kết quả có độ chính xác cao. Để tăng số biểu ghi tìm 
được, có thể áp dụng những giải pháp sau: 

~ loại bỏ một số khái niệm không quan trọng; 

- dùng các thuật ngữ thông dụng hơn thay cho thuật ngữ 
quá chuyên sâu hoặc không thông dựng; 

- dùng kỹ thuật chặt cụt để nâng cao hơn kết quả; 

- dùng chỉ số phân loại ở cấp cao hơn để làm lệnh tìm. 


225 


5. CHIẾN LƯỢC TÌM TIN TỰ ĐỘNG HOÁ 

Tìm tin tự động hoá là một hoạt động khoa học, gồm 
nhiều bước có quan hệ logic với nhau và cần được thực hiện 
với những chiến lược hợp lý. Trong những tài liệu khác 
nhau về tìm tin, người ta sử dụng thuật ngữ "chiến lược” 
theo nhiều cách khác nhau. Có những tài liệu sử đụng thuật 
ngữ "chiến lược” để thể hiện việc hình thành câu hỏi, biểu 
thức tìm. Đôi khi người ta sử dụng thuật ngữ "chiến lược" 
để đề cập đến những hành động, thao tác ở một thời điểm 
nhất định của quá trình tìm kiếm hoặc đến những quyết 
định về cách thức nào là tốt nhất để tiếp tục để đạt được 
mục đích. Trong khuôn khổ chương trình này, chúng ta 
định nghĩa chiến lược tìm tin là kế hoạch tổng quát được 
vạch ra hoặc cách tiếp cận nhằm đạt (ưỢC mục tiêu tÌm tin 
đã dược xác định trong quá trình phán tích nhu cầu tín. 

Chiến lược tìm tin có thể bao trùm một số bước khác 
nhau của quá trình tìm tin. Trong xác định chiến lược tìm 
tim, người tìm tin phải chú ý và xem xét nhiều vấn đẻ trước 
khi tạo lập biểu thức tìm. Những vấn đề này có thể bao 
gồm: 

- Những khái niệm hoặc khía cạnh cần tìm kiếm và thứ 
tự của chúng: 

- Những thuật ngữ phù hợp để thể hiện khái niệm tìm 
kiếm; 

- Những đặc tính của hệ thống tìm tin đang sử dụng; 

- Những giải pháp cần tiến hành khi duyệt lại biểu thức 
tìm. 
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Để xây dựng được một chiến lược phù hợp, đời hỏi người 
tìm tin phải có những hiểu biết về bản chất và tổ chức của 
cơ sở dữ liệu mục tiêu và nắm bắt được nhu cầu tin của 
người dùng tin. Sự hiểu biết chính xác về nhu cầu tin cho 
phép xác định chính xác mục tiêu tìm tin của người dùng 
tin (Ví dụ như muốn có danh mục đầy đủ tài liệu liên quan, 
muốn có một số ít tài liệu rất phù hợp với yêu cầu, v.v...). 
Cân cứ những mục tiêu tìm tin của người dùng tin, có thể có 
ba kiểu tìm tin: 

- Tìm tin có độ đây đủ cao: được tiến hành khi người 
dùng tin muốn có tất cả những biểu ghi phù hợp về chủ đề 
quan tâm: 

- Tìm tin với độ chính xác cao: được tiến hành khi 
người dùng tin chỉ cần những biểu ghi phù hợp và rất ít 
nhiễu tin (ít biểu không phù hợp) ; 

- Tìm tin ngắn gọn (brief search): được tiến hành khi 
người dùng tin chỉ cần một ít biểu ghi phù hợp mà không 
cần lấy tất cả biểu ghi phù hợp. 

Phụ thuộc vào yêu cầu tin, vào sự hiểu biết của người 
cán bộ tìm tin về vấn đề tìm tin, về hệ thống tìm tin, về cơ 
sở dữ liệu được lựa chọn, về phần mềm tìn tin, người 
chuyên gia tìm tin có thể xác định và chọn một chiến lược 
phù hợp cho quá trình tìm tin. 

Các chuyên gia tìm tin đã đề xuất nhiều chiến lược tìm 
tin khác nhau. Mỗi chiến lược đều có những đặc thù riêng. 
Về tổng thể có thể phân loại các chiến lược tìm thành một 
số dạng chiến lược tổng quát như sau: 
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- Chiến lược tìm ngắn gọn; 

- Chiến lược xây dựng khối; 

- Chiến lược các bước liên tiếp (thu hẹp dần dần): 

- Chiến lược mở rộng dần dân. 

a Š.F. Chiến lược tìm ngắn gọn 

Chiến lược tìm ngắn gọn (Brief search) là cách tiếp cận 
đơn giản và trực tiếp nhất. Tìm ngắn gọn là cách tìm sử 
dụng một biểu thức tìm đơn với một số ít thuật ngữ tìm và 
toán tử boole và có mục đích tìm ra một số biểu ghi phù 
hợp. Chiến lược này được thường được tiến hành nhằm có 
được những hiểu biết, ý tưởng cơ bản về cơ sở đữ liệu đang 
sử dụng để có những điều chỉnh hợp lý sau này. 

Chiến lược tìm ngắn gọn thường đưa ra kết quả tìm với 
độ đây đủ thấp bởi khái niệm chỉ được trình bày bằng một 
số ít thuật ngữ. 

Ví dụ, với câu hỏi “Tôi muốn tìm một số thông tin để 
nghiên cứu có những giống lúa tốt cho vững cao, ít! nước 
tưới, khô han”, người tìm tin có thể tạo ra một biểu thức 
tìm ngắn gọn, đơn giản (với toán tử của CDS/ISIS): 





lứa * chọn giống * vùng cao 


a_5.2. Chiến lược xáy dựng khối 

Chiến lược xây dựng khối (Building blocks stratepy) là 
kế hoạch tìm tin trong đó biểu thức tìm tin được chuẩn bị 
Kỹ và thiết lập chỉ tiết ngay từ đầu thông qua việc nghiên 
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cứu kỹ lưỡng yêu cầu tín. Chiến lược này có những đặc 
trưng sau: 

Mọi khái niệm, thuật ngữ tìm được xác định trước và 
được thể hiện trong biểu thức ngay từ đầu; 

Những thuật ngữ có quan hệ tương đương được xếp vào 
khối; phụ thuộc vào yêu cầu tin, có thể có nhiều khối: 


Thưảt nữ AI OR === F 
Thuải nhữ A2 OR Thuất ngữ BỊ Thuật ngữC|: ÖR 
: OR Thuật nữ CC? LIR 
Thuát ngữ B2 _ 

QR Thuải nuữ Chị 




















'Thuải nữ An 





“Thuật ngỡ Bn 


Biểu thức lim với 
cáu toán tử thể 


hiện quan hệ 
giữa các khối 


Hệ thóng tim tin 


Kêt quả tìm tin 


Í-J 


Hình 9. Sơ đỏ tổng thể chiến lược khốt xây dựng 
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" Các quan hệ giữa các thuật ngữ và giữa các khối được 
thiết lập từ đầu theo cú pháp của hệ thống tìm tin; 

"Biểu thức tìm được thiết kế chỉ tiết tối đa, viết sẵn 
thành câu hỏi. 

®* Mọi bước được chuẩn bị trước từ xem kết quả, lưu kết 
quả đến in ấn kết quả đều được thiết lập sắn, 

Sơ đồ tổng thể thể hiện chiến lược Khối xây dựng được 
trình bày trong hình 9. 

Với những khái niệm và thuật ngữ được chọn trên, chúng 
ta có thể tạo ra một biểu thức tìm theo chiến lược Khối xây 
dựng sử dụng toán tử của CDS/ISES với các khối như sau: 


(lúa + lúa nước + lúa nương + 0ryza safiva) * (hạn + 
chịu hạn + khô vùng cao) * (chọn giống + chọn lọc + iạo 
eiống) 


Chiến lược xây dựng khối trong thực tế có thể được thực 
hiện với một lệnh tìm nhưng cũng có thể được thực hiện 
theo các bước tuần tự: thực hiện tìm lần lượt theo từng khối, 
sau đó thực hiện lệnh tìm kết hợp kết quả của từng khối. Ví 
dụ, với câu hỏi đã nêu, chúng ta có thể thực hiện chiến lược 
tìm theo 4 bước với 4 biểu thức tìm, mỗi biểu thức tương 
ứng với một khối (một khái niệm): 

# lứa + lúa nước + lúa nương + 0FYZa sativa 


#2 hạn OR chịu hạn OR khô vùng cao 
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#3 chọn giống + chọn lọc + tạo giống 

#4 #] * #2 * #3 

trong đó #l, #2, #3, #4 là ký hiệu câu hỏi thứ 1,2,3 và 4 
trong chương trình tim ttn CDS/ISIS. 

Chiến lược xây dựng khối thực hiện cách tiếp cận tìm tin 
đảm bảo đồng thời độ đầy đủ và độ chính xác. Chiến lược 
này được áp dụng hiệu quả khi người tìm tin hiểu biết hệ 
thống, làm việc với những yêu cầu tin quen thuộc. 

a 5.3. Chiến lược các bước liên tiếp 

Mội chiến lược khác cũng thường được áp dụng trong 
tìm tin tự động hoá là Chiến lược các bước liên tiếp. Chiến 
lược này còn có thể gọi là chiến lược thu hẹp dần dần. 
Chiến lược này tìm tín theo tiếp cận thu hẹp dần dần, được 
đặc trưng với những điểm cơ bản sau: 

"_ Bất đầu bàng việc tìm theo những khái niệm mức bao 
quát rộng hơn (với các thuật ngữ tìm có tầm trọng nhất 
trước, các đề mục bao quát rộng hơn) để đảm bảo độ đây 
đủ). 

=_ Dựa vào kết quả tìm được thu hẹp dần lại bằng cách 
chợn từ khoá mới/từ khoá khác, dùng kết hợp AND để thu 
hẹp dần lại 

Chiến lược các bước liên tiếp được gọi là Chiến lược thu 
hẹp dần dần bởi việc tìm tin sẽ bất đầu bằng một phương 
diện tìm kiếm chính, quan trọng nhất, sau đó thu hẹp dần 
lại bằng biểu thức tìm có kế tiếp kết quả trước sử dụng toán 
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tử AND với khái niệm kế tiếp sau để nâng cao độ chính 
xác. 

sơ đồ mô tả chiến lược thu hẹp dần được thể hiện trong 
hình I0. Chiến lược này áp dụng cách tiếp cận đảm bảo độ 


đầy đủ cao từ đầu, sau đó thu hẹp dần để nâng cao độ chính 
xác của kết quả. 










Khái niệm ] 
Thuật nuữ A | 
Thuạt ngự 
A3... 
Thuật ngữ An 


Iasser| 


Khái niệm 2 
Thuật nrữ BI 





Thuật ngừ Bà 
AND 


Thuật nrữ lần 





Khái niệm 3 


SÓ SOẠN Thưát ngũ CÍ 
Kết quả thm 2 # 





“Thuật ngữ Cn 





|_ Kê quả tìm 3 


Hình 10. Chiến lược các bước liên tiếp 
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a 3.4. Chiến lược mở rộng dần dần 

Một chiến lược tìm tin khác thường được sử dụng khi 
người dùng tin có nhu cầu về số ít những tài liệu phù hợp, 
hạn chế số biểu ghi không phù hợp. Chiến lược mở rộng 
dần dân từ tài liệu hạt nhân còn được các chuyên gia tìm tin 
thế giới gọi là Chiến lược "Nuôi ngọc trai" (Growing pearl) 
(coi tài liệu hạt nhân như một hạt ngọc, từ đó nhân rộng 
lên). Chiến lược mở rộng từ tài liệu hạt nhân được đặc trưng 
với một số điểm sau: 

® Việc tìm kiếm bắt đầu từ việc tìm một hoặc một vài 
tài liệu hạt nhân rất phù hợp với yêu cầu tin (có thể là một 
vài tài hiệu đã được gợi ý) 

" Dựa vào các tài liệu tìm được trên, hiệu chỉnh biểu 
thức tìm bằng việc lựa chọn từ khoá hoặc các đặc trưng 
khác rút ra từ những biểu ghi đã tìm được. 

=. Kết hợp để nâng dần kết quả tìm tin lên. 

Chiến lược này sử dụng cách tiếp cận đảm bảo độ chính 
xác cao trước tiên, sau đó mở rộng để nâng dân độ đầy đủ. 

Trong thực tế, người cán bộ tìm tin phải linh hoạt trong 
việc áp dụng chiến lược tìm tin. 


6. TÌM TIN TRỰC TUYẾN 


Tìm tin trực tuyến (tiếng Anh là Online Information 
Retrieval) là quá trình tìm tin tự động hoá mà trong đó 
người tìm tin sử dụng máy tính điện tử để giao tiếp với dịch 
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vụ thông (in trực tuyến ở xa để thoả mãn nhu cầu tin của 
mình. 

Người tìm tin trực tuyến không nhất thiết phải là người 
có nhu cầu tin. Họ có thể lả người cán bộ tìm tin trung gian 
thực hiện dịch vụ tra cứu để đáp ứng nhu cầu tin của người 
dùng tin. Khi người tìm tin là người trực tiếp có như cầu tin, 
họ là người dùng tin trực tiếp hoặc còn có thể gọi là người 
dùng tin đầu cuối (end user). 

Tìm tin trực tuyến được thực hiện thông qua máy tính 
điện tử hoặc thiết bị đầu cuối (terminal) kết nối với máy 
tính chủ trung tâm từ xa thông qua hệ thống mạng máy tính 
và mạng truyền thông. 

Sơ đồ giản lược thể hiện liên kết giữa máy tính điện tử 
đầu cuối và máy chủ từ xa được thể hiện qua hình 1 ï. 

Máy tính điện tử có thể kết nối với máy chủ từ xa thông 
qua kênh điện thoại công cộng (phương pháp quay số, dial- 
up), kênh thuê bao riêng (leased line), qua mạng máy tính 
hoặc Internet. Vào thòi kỳ đầu khi ngành công nghiệp 
thông tin trực tuyến mới phát triển, các thiết bị đầu cuối 
không có khả năng xử lý dữ liệu. Việc xử lý dữ liệu dựa 
hoàn toàn vào năng lực của máy chủ từ xa. Những thiết bị 
đầu cuối như vậy được gọi là thiết bị đầu cuối cảm (dump 
terminal). Với sự phát triển của công nghệ thông tin, máy 
tính cá nhân được sử dụng làm các thiết bị đầu cuối. Máy 
tính cá nhân có năng lực xử lý dữ liệu nên được gọi là thiết 
bị đầu cuối thông tin. 
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Máy chủ từ xa có thể là của cơ quan. tổ chức đưa lên 
mạng thông tin, cho phép người dùng tin truy cập và khai 
thác dữ liêu trong các cơ sở dữ liệu. Tuy nhiên máy chủ từ 
xa cũng có thể là của những dịch vụ thông tin trực 
tuyến,thực hiện dịch vụ trên cơ sở thu phí. Ngày nay có 
hàng ngàn dịch vụ như vậy trên thế giới. Thí dụ dịch vụ 
DIALOG cho phép truy cập trên 400 cơ sở dữ liệu khác 
nhau, dịch vụ Š5TN cho phép truy cập hơn 200 cơ sở đữ liệu 
về khoa học và công nghệ. 

a 6.! Quá trình phát triển của công nghiệp thông tin 

trực tuyến 

Hoạt động thông tin trực tuyến đã trở thành một ngành 
công nghiệp có sự gia tăng rất nhanh. Ngành công nghiệp 
thông tin trực tuyến đã phát triển qua một số giai đoan 
chính như sau: ì 

Œiai đoạn I. Giai đoạn hình thành và cung cấp dịch 
không trực tuyến 

Giai đoạn này bát đầu vào những năm 1960 khi máy tính 
điện tử được ứng dụng vào hoạt động thư viện-thông tin. 
Trong thời ký này, máy tính điện tử được ứng dụng vào việc 
tạo ra các cơ sở dữ liệu trên bảng từ. Việc phục vụ thông tin 
được thực hiện theo phương thức không trực tuyến (thco lô - 
batch mode). Có thể kể đến một số cơ sở đữ liệu lớn được 
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hình thành trong thời kỳ đầu tiên này như Index Medicus 
(Mỹ) trong lĩnh vực y học, CA (của Chemical Abstracts 
Se€rvIces). 

Giai đoạn 2. Triển khai hoạt động cung cấp dịch vụ trực 
tuyến 

Giai đoạn này diễn ra trong khoảng thời gian từ cuối 
những năm 1960 đến đầu những năm 1980. Trong giai đoạn 
này, đã xuất hiện các dịch vụ trực tuyến. Các hệ thống sử 
dụng thiết bị đầu cuối (terminal) để truy cập đến các cơ sở 
dữ liệu lưu trữ trên các bộ nhớ của máy tính từ xa với sự 
giúp đỡ của các cán bộ thông tin chuyên nghiệp. Nhờ các 
tiến bộ của kỹ thuật, đặc biệt của công nghệ thông tin và 
truyền thông, việc kết nối được thực hiện qua kêh điện thoại 
mà không bị sai lệch dữ liệu. Vào thời ký này đã xuất hiện 
các mày tính có bộ xử lý trung tâm mạnh, tốc độ xử lý 
nhanh, làm việc theo chế độ phân thời (time sharing), nhờ 
đó cho phép nhiều người đồng thời khai thác cơ sở dữ liệu. 

Giai đoạn 3. Giai đoạn phát triển bùng nổ 

Giai đoạn này bắt đầu từ đầu những năm 1980 và đặc 
trưng với sự phát triển bùng nổ của của các dịch thông tìn 
trực tuyến (Xem bảng ]0). 
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Bảng 10. Sự phát triển ngân hàng dữ liệu 





SốCSDL | Số nhà sản | Số lượng 
xuất CSDL_ dịch vụ 


1979/1980 


1960/1981 














Trong giai đoạn này, các dịch vụ thông tin trực tuyến 
tăng liên tục; xuất hiện các dịch vụ với những phần mềm 
mạnh, tính năng cao, phức tạp. Sự phát triển của các dịch vụ 
trực tuyến đã tạo ra những ngân hàng dữ liệu rất lớn như 
DIALOG, SIN, DATASTAR,... 

Trong giai đoạn này đã xuất hiện công nghệ CDROM, 
cho phép đưa cá cơ sở đữ liệu trực tuyến lên CDROM để 
phổ biến cho người sự dụng đầu cuối, giúp cho việc truy 
cập những cơ sở dữ Hệu trở nên dễ dàng hơn, có thể thực 
hiện theo phương thức tại chỗ. 

Giai đoạn 4. Giai đoạn phát triển mạng Internet 

Giai đoạn này đặc trưng với sự phát triển của mạng 
Internet, làm cho việc truy cập mạng trở nên dễ dàng hơn 
nhiều; các dịch vụ trực tuyến đã cho phép người sử dụng 
truy cập dịch vụ của họ qua mạng Internet; nguồn tin điện 
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tử đã , phát triển nhanh; hình thành các tổ hợp thông tín 
điện tử (Aggregators) và cung cấp khả năng truy cập đến 
các cơ sở đữ liệu toàn văn. 

Ngày nay với sự phát triển của thư viện điện tử, cổng 
giao tiếp điện tử, các dịch vụ thông tin trực tuyến cung cấp 
ngày càng nhiều hơn các dịch vụ truy cập cơ sở dữ liệu toàn 
vn. 

q 6.2 Các thành phần của công nghiệp thông tỉn trực 

tuyến 

Những thành phân cơ bản trong dịch vụ tìm tin trực 
tuyến bao gồm: 

- Các nhà sản xuất cơ sở dữ liệu 

- Các nhà cung cấp dịch vụ trực tuyến 

- Người dùng tin; 

6.2.1 Các nhà sản xuất cơ sở dữ liệu 

Các nhà sản xuất cơ sở đữ liệu thông thường là các hội 
nghề nghiệp lớn (như Hội Hoá học Mỹ), các tổ chức nghiên 
cứu khoa học lớn (như Trung tâm Nghiên cứu khoa học 
quốc gia Pháp....), các thư viện lớn (như thư viện Quốc hội 
Mỹ, Thư viện Y học Mỹ,..). Các tổ chức này từ nhiều năm 
trước đây đã lĩnh trách nhiệm tổ chức nguồn tin để cung cấp 
cho người dùng tin của mình theo một số lĩnh vực khoa học 
và công nghệ nhất định. Các nhà sản xuất cơ sở dữ liệu còn 
là các cơ quan thông tin quy mô quốc gia và quốc tế. 

Nhiều cơ quan cung cấp dịch vụ trực tuyến cũng tiến 
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hành xây dựng các cơ sở dữ liệu để cung cấp dịch vụ cho 
khách hàng. 

6.2.2 Các nhà cung cấp dịch vụ Irực tuyến 

Các nhà cung cấp dịch vụ trực tuyến, đôi khi được gọi là 
các nhà bán hàng trực tuyến (Vendor), là những tổ chức, 
doanh nghiệp có năng lực thiết bị tin học, có phần mềm phù 
hợp cho phép quản trị các cơ sở dữ liệu, cho phép quản lý 
người dùng tin truy cập khai thác cơ sở đữ liệu. Các nhà sản 
xuất cơ sở đữ liệu cấp phép cho các nhà cung cấp dịch vụ 
trực tuyến sử dụng cơ sở đữ liệu hoặc thuê cơ sở dữ liệu để 
thực hiện các dịch vụ thông tin trực tuyến. 

6.2.3 Người dùng tìn 

Người dùng tin có thể bao gồm hai loại chính: 

- Hộ dùng tin tập thể: đó có thể là các trung tâm thông 
tin, thư viện, tổ chức khoa học và công nghệ, doanh nghiệp,. 
Họ khai thác các dịch vụ trực tuyến phục vụ cho nhu cầu 
thông tin của tổ chức mình hoặc cho khách hàng của mình. 

- Người dùng tin trực tiếp: đó là các cá nhân trực tiếp 
khai thác dịch vụ trực tuyến để thoả mãn nhu cầu tin của 
chính bản thân mình. 

Ngày nay với sự xuất hiện của các cơ sở dữ liệu trên 
CDROM, phát triển của mạng Internet, các phần mềm dễ sử 
dụng, các nhà cung cấp dịch vụ trực tuyến đang đẩy mạnh 
cung cấp dịch vụ đến người dùng tin trực tiếp. 

Tuy nhiên người cán bộ tìm tin chuyên nghiệp vẫn đóng 
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vai trò quan trọng trong quá trình tìm tin trực tuyến.Họ phải 
là những người đào tạo, hướng dẫn, định hướng người dùng 
tín, là người tư vấn vẻ nguồn tin cho người dùng tin trực 
tiếp. 

Trong hoạt động thông tin trực tuyến còn hai thành phần 
khác cũng có vai trò quan trọng là cc nhà cung cấp dịch vụ 
truyền thông và các nhà cung cấp phần cứng và phẩn mềm. 


7. TÌM TIN TRÊN CD-ROM 

1a Z.Í.CD-ROM và cở sở dữ liệu trên CD-ROM 

CD-ROM là một dạng bộ nhớ chỉ đọc được ứng dụng 
ròng rãi trong hoạt động lưu trữ và tìm tin. Thuật ngữ CD- 
ROƠM được tạo ra từ các chữ cái đầu của cụm từ tiếng Anh 
Compact Disc Rcad Only Memory (Bộ nhớ chỉ đọc trên đĩa 
nén). Những đĩa này được gọi là đĩa nén (compact disc) bởi 
đĩa CD-ROM thông dụng chỉ có đường kính nhỏ (12 cm) 
nhưng dung lượng nhớ của đĩa lên đến 650Mb (vào thời 
điểm mới xuất hiện công nghệ đĩa CD-ROM. máy tính cá 
nhân thông thường có bộ nhớ đĩa cứng khoảng 40-80 Mb) . 
Với dung lượng như vậy, một đĩa CD-ROM có khả năng 
chứa dữ liệu tương đương với 464 đĩa mềm ¡,2Mb. Dung 
lương nhớ đó có thể lưu trữ được số ký tự ghi trên 200,000 
đến 300.000 trang giấy khổ A4, hoặc tương đương 1 tấn 
giấy. 

Nhờ khả năng lưu trữ thông tin có dung lượng lớn, CD- 
ROM được sử dụng như các bộ nhớ lưu trữ các loại hình dữ 
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liệu đa dạng từ văn bản, đồ hoạ, hình ảnh, âm thanh, hình 
ảnh động, dữ liệu đa phương tiện hoặc bất kỳ một tập hợp 
nào của các dạng dữ liệu trên. 

Đĩa CD-ROM được đọc bảng một thiết bị đọc chuyên 
dụng goi là đầu đọc CD-ROM. Có thể có nhiều loa: đầu đọc 
CD-ROM. Đầu đọc CD-ROM đơn lẻ được gắn trực tiếp vào 
máy tính như một ổ đĩa thông thường. Có những thiết bị 
đọc CD-ROM được lắp độc lập bên ngoài máy tính và hoạt 
động như mội thiết bị ngoại vi. Nhiều đầu đọc C1-ROM có 
thể được tích hợp vào một thiết bị chuyên dùng gọi là Tháp 
CD-ROM (CD-ROM Tower) với nhiều đầu đọc (4 đầu hoặc 
7 đầu đọc). 

Các thiết bị đọc CD-ROM có thể được tích hợp vào 
mạng máy tính để có thể khai thác dữ liệu trên điã CD- 
ROM theo chế độ mạng. Người ta cũng đã chế tạo được 
những thiết bị đặc biệt gọi là Thùng CD-ROM (Iukebox) có 
khả năng lưu giữ đồng thời hàng tram đĩa CD-ROM, có thể 
chọn và đưa đĩa CD-ROM vào khai thác tự động trên mạng 
theo yêu cầu. 

Ngày nay, với sự phát triển của khoa học và công nghệ, 
bên cạnh CD-ROM, công nghệ đĩa quang còn tạo ra nhiều 
loại đĩa quang khác như CD-PLUS, CD-R, WORM, DVD 
và đĩa quang ghi xoá được. CD-PLUS là đĩa quang thường 
được dùng để lưu nhạc trên những thiết bị nghe nhìn bình 
thường hoặc được dùng để lưu nhạc và hình ảnh khi nghe 
bằng nhạc bằng máy tính. CD-R cho phép người dùng có 
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thể ghi dữ liệu lên đó bằng thiết bị chuyên dụng gọi là CD- 
Writer. WORM là là loại đĩa CD-ROM ghi một lần và đọc 
được nhiều lần. Thuật ngữ WORM được tạo từ cụm từ 
tiếng Anh Wnie Once Read Many (Ghi một lần đọc nhiều 
lân). Đĩa WORM có thể được sử đụng để sao lưu đữ liệu rất 
thuận tiện. Đĩa CD ghi xoá được thực chất là loại đĩa 
quang-từ tính (Magneto-optical CD) có thể ghi và xoá dữ 
liệu nhiều lần. Đĩa DVD là loại đĩa quang kỹ thuật số 
(DigHal Versalite Disc), tương tự như CD-ROM nhưng có 
khả năng lưu trữ dữ liệu rất lớn, tới 4.8 Gigabytes trên mỗi 
mặt đĩa. Đĩa DVD ngay nay đang trở nên rất thông dụng và 
được sử dụng nhiều trong việc lưu trữ các thư viện điện tử, 
tạp chí toàn văn. 

Khả năng lưu trữ dữ liệu lớn, độ bền cao, dễ bảo quản, 
vận chuyển và sử dụng đã cung cấp cho đĩa CD-ROM một 
ưu thế lớn trong việc lưu giữu các cơ sở dữ liệu, kể cả 
những cơ sở dữ liệu toàn văn hoặc đa phương tiện. 

Cơ cở dữ liệu trên CD-ROM ngày nay rất đa dạng. Nó 
bao quát các loại hình cơ sở đữ liệu như trên các ngân hàng 
dữ liệu. 

Nhiều nhà sản xuất cơ sở dữ liệu đã đưa toàn bộ hoặc 
từng phần cơ sở dữ liệu lớn lên trên CD-ROM và phát hành 
trên thị trường. Ví dụ Hiệp hội Hoá học Mỹ đã sản xuất đĩa 
CD-ROM cơ sở dữ liệu Chemicai Abstracts, một trong 
những CSDL nổi tiếng thế giới. Hoặc Viện Thông tín Khoa 
học Quốc gia Pháp đã sản xuất đĩa CD-ROM chứa cơ sở dữ 
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liệu PASCAL từ năm 1987 đến nay với khối lượng khoảng 
hơn 6 triệu biểu phi. 

Nhiều nhà sản xuất cơ sở dữ liệu đã cung cấp các cơ sở 
dữ liệu toàn văn trên CD-ROM. Ví dụ Hiệp hội Kỹ sư Điện 
và Điện tử (IEEE/IEE) đã cung cấp một Thư viện điện tử 
trên CD-ROM (IEL) gồm cơ sở dữ liệu tra cứu và tài liệu 
toàn văn trên CD-ROM. IEL là một thư viện điện tử lưu trữ 
dữ liệu thông tin có thể truy cập được thuộc lĩnh vực điện - 
điện tử. IEL chứa hơn 600.000 tài liệu toàn văn được thu 
thập từ hơn 12.000 ấn phẩm với hơn 2.000.000 trang các tạp 
chí, tà: liệu hội nghị, hội thảo và các tiêu chuẩn thuộc lĩnh 
vực điện - điện tử xuất bản từ năm 1988 đến nay và hàng 
tháng được cập nhật khoảng 25.000 trang. Với chương 
trình tìm kiếm thông tin trên Web IEL, 2.0, người sử dụng 
có thể thực hiện các lệnh tìm kết hợp linh hoạt giữa tên tác 
giả, chủ đề, tiêu chuẩn và các tham số khác. Trong chế độ 
xem thông tin, bạn có thể xem từng bài báo, từng tạp chí 
cũng như in danh sách kết quả tìm, biểu ghi thư mục và đọc 
filc toàn văn trên format PDF trên máy tính. 

Nhờ có công nghệ CD-ROM, nhiều cơ sở dữ liệu trước 
đây chỉ có thể khai thác theo chế độ trực tuyến nay đã có 
thể khai thác theo chế độ cục bộ. Vì vậy một số người quan 
niệm rằng khai thác Cơ sở dữ liệu trên CD-ROM có thể 
được gọi là khai thác trực tuyến, tuy nhiên điểm khác biệt là 
cơ sở dữ liệu không còn là từ xa nữa mà có thể được lưu giữ 
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ngay tại chỏ, không phải sử dụng tới các hệ thống viễn 
thông đát tiền. 

Số lượng các cơ sở đữ liệu trên CD-ROM được tăng lên 
liên tục hàng năm. Người ta ta ước tính từ năm 1985 đến 
nay, số lượng các cơ sở dữ liệu được đưa ra khai thác trên 
CD-ROM năm sau tăng pấp 2 lần năm trước. 

Sự xuất hiện của cơ sở dữ liệu trên CD-ROM và công 
nghệ sản xuất đĩa CD-ROM đã có tác động nhất định đến 
thị trường thông tin trực tuyến. Nhiều cơ quan, đặc biệt là ở 
những trường đại học, đã chuyển đần từ khai thác thông tin 
trực tuyến sang khai thác thông tin trên CD-ROM bởi nhiều 
ưu thế của cơ sở dữ liệu trên CD-ROMI (Xem bảng so sánh). 
Người ta đã nhận thấy ở các nước phát triển việc mua cơ sở 
dữ liệu trên CD-ROM có những đặc điểm khác biệt phụ 
thuộc vào loại hình cơ quan. 

- Các trường đại học tăng cường mua cơ sở đữ liệu trện 
CD-ROM và giảm số lần tìm tin trực tuyến 

- Các doanh nghiệp ít mua sản phẩm cơ sở dữ liệu trên 
CD-ROM mà vần dựa vào khai thác trực tuyến. 

Điều này có thể giải thích được bởi yêu cầu thông tin của 
doanh nghiệp và của các trường đại học hay viện nghiên 
cứu có khác nhau. Doanh nghiệp cần những thông tin có 
tính cập nhật nhanh, thậm chí thông tin cần được cập nhật 
tức thời (thông tin thời gian thực). 

Việc đưa cơ sở dữ liệu lên CD-ROM cũng có ảnh hưởng 
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rõ rệt đến thị trường các sản phẩm tra cứu trên giấy như 
Chemical Abstracts. Index Mecdicus,...Các cơ quan thông 
tin thư viện có xu hướng mua các sản phẩm cơ sở dữ liệu 
trên CD-ROM thay cho việc mua các ấn phẩm tóm tắt trên 
giây. 

a 7.2 So sánh tìm tín trên CD-ROM với tìm tin trực 

tuyến 

Việc khai thác cơ sở dữ liệu trên CD-ROM có những ưu 
thê nhưng cũng có những hạn chế nhất định so với khai thác 
trực tuyến. 

7.2.1 Uu điểm của tìm tin trên CD-ROM: 

© Chí phí viễn thông: Không mất chỉ phí viễn thông để 
truy cập cơ sở đữ liệu từ xa, Không mất chi phí cho thời 
gian truy cập hệ thống từ xa 

® Phần mềm: Có hảu hết thế mạnh của phần mềm tìm 
tin, Phần mềm dẻ cài đạt, Có hầu hết các phương thức tìm 
tin cơ bản (theo đồng lệnh, theo thực đơn) 

®© Truy cập không hạn chế: cung cấp cho người sử dụng 
khả năng truy cập không han chế cho một năm mua cơ sở 
đữ liệu. 

® Khả năng lưu trữ cao, độ bền đáng kể. Chi phí sao lưu 
không lớn 

® Có khả năng cho phép nhiều người, kể cả người 
không chuyên nghiệp tìm kiếm trực tiếp 


© Có thể cung cấp đa dạng những loại hình dữ liệu: văn 
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bản, đồ hoạ, âm thanh, hình ảnh, hình ảnh động hoặc tổ hợp 
những loại đó. 

® áp lực tâm lý lên người tìm tin thấp hơn khai thác trực 
tuyến. Có thể lặp lại nhiều lần các bước tỉm tin mà không 
ảnh hưởng đến phí truy nhập 

e© Xem dữ liệu. lựa chọn đữ liệu dễ dàng hơn 

7.2.2 Nhược điểm so với tìm tin trực tuyến 

e© Phải chí cho việc mua quyền truy cập cơ sở dữ liệu 
trên CD-ROM hàng năm. 

e Chị phí cho mua thiết bị nhiều ổ đọc đồng thời, xây 
dựng mạng khá lớn 

e Tính cập nhật không cao bảng trực tuyến. Khối lượng 
dữ liệu truy cập được ít hơn. 

e© Số lượng cơ sở đữ liệu ít hơn so với trực tuyến (cơ sở 
đữ liệu trực tuyến đa đạng hơn, cho phép truy cập nhiều cơ 
sở đữ liệu thuộc nhiều lĩnh vực khác nhau 

e Khai thác theo chế độ mạng cũng đời hỏi kinh phí cao 

e© Sự tương hợp giữ các thiết bị và phần mềm. 

e Một số yếu tố dữ liệu trên trực tuyến có thể không có 
khi đưa lên CD-ROM 

Việc lựa chọn giữ khai thác trên CD-ROM hay khai thác 
trực tuyến phụ thuộc vào nhiều yếu tố khác nhau như: 

- Tần suất sử dụng 


- Diện bao quát đẻ tài 
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- Yêu cầu về độ hồi cố 

- Đồi hỏi về tính cập nhật 

Nếu tần suất sử dụng một số cơ sở dữ liệu nào đó mà cao 
thì nên mua CD-ROM. Trong trường hợp nếu tần suất sử 
dụng thấp, nhu cầu không cao thì nên khai thác trực tuyến, 
như vậy sẽ phù hợp hơn về chi phí và lợi ích. 

Nếu điện bao quát đề tài rộng thì cần suy nghĩ đến thuê 
bao trực tuyến bởi nó cung cấp khả năng tiếp cận nhiều cơ 
sở dữ liêu hơn. 

Ngày nay việc sản xuất cơ sở dữ liệu trên CD-ROM đã 
trở nên đơn giản hơn nhiều. Do công nghệ sản xuất đĩa CD- 
ROM ngày càng phát triển nên giá đĩa CD-ROM ngày càng 
giảm. Giá sản phẩm trên CD-ROM vẻ thực chất là giá thuê 
bao cơ sở dữ liệu trên đó. 

Việc phát triển công nghệ đĩa sản xuất CD-ROM ghi xoá 
được và và đầu đọc/gh:i CD-ROM đã giúp cho nhiều cơ 
quan thông tin thư viện có thể tự sản xuất ra những đĩa CD- 
ROM cơ sở dữ liệu của mình và phổ biến trên thị trường. 
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CHƯƠNG V 
TÌM TIN TRÊN MANG INTERNET 


1. NHŨNG KHÁI NIỆM CƠ BẢN VỀ INTERNET 

Trong hoạt động thông tin tin ngày nay, không thể 
không nói đến Internet, một hệ thống thông tin khổng lồ 
cung cấp đa dạng những thông tin về mọi lĩnh vực khoa 
học, kinh doanh, kinh tế, xã hội, văn hoá, nghệ 
thuật....Intermet là công cụ giúp người ta truy cập được đến 
các thư viện ảo, mục lục thư viện trực tuyến (OPAC), cơ sở 
dữ liệu trực tuyến, tạp chí điện tử. 

1 Ÿ.I. Định nghĩa Internet 

Internet là một mạng thông tin toàn cầu và là một nguồn 
thông tin khổng lồ của nhân loại. Sự hình thành và phát 
triển có tính chất bùng nổ của Internet được coi là một 
trong những thành tựu khoa học và công nghệ vĩ đại của thế 
kỷ 20. lnternct chứa một khối lượng thông tin thuộc mọi 
lĩnh vực từ tình tế xã hội, khoa học công nghệ, giáo dục và 
đào tạo, thương mại, thị trường, giá cả, dự báo thời tiết, 
thông tin giải trí..... : 

Lúc đầu Internet được định nghĩa là “mạng của tất cả 
các mạng máy tính sử dụng giao thức IP (giao thức 
kmernet}°. Hiện nay điều này không còn hoàn toàn chính 
xác nữa vì nhiều mạng máy tính với kiến trúc khác (không 
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dùng IP) nhưng nhờ có các cầu nối đa giao thức 
(Multiprotocol Gateway) nên vân có thể nối kết được vào 
Internet và sử dụng đây đủ các dịch vụ thông tin trên 
[nternet. 

Ngày 24/10/1995 Hội đồng Mạng liên bang Mỹ (The 
U.S Federal Networking CouncH) đã nhất trí thông qua định 
nghĩa: 

“Imternet là một hệ thống thông tín loàn Cu mà Hồ - 

-_ Được kết nối với nhau một cách logic thông qua mỘi 
hệ thông địa chỉ IP (Internet Protocol) duy nhất toàn cầu 
hoặc dựa trên những giao thức mở rộng hoặc tương thích 
của ÍP. 

- Có khả năng hỗ trợ chương trình truyền thông sử dụng 
giao thức TCPIIP (Transmission ConHrol Protocoll lmnternel 
Protocol, còn gọi là giao thức điều khiển truyền dân! giao 
thức lruternel ), hoặc các giao thức tương thích hoặc mở 
rộng. 

- Cng cấp, sử dụng hoặc làm cho các dịch vụ cấp cao 
nằm trên tầng truyền thông hoặc các hạ tầng liên quan có 
thể truy cập được một cách công cộng hoặc cá nhân”. 

Nghỉ định 55/2001/CP-NĐ của Chính phủ ngày 
23/8/2001 về hoạt động Internet đã định nghĩa “lmternet là 
một hệ thống thông tín được kết nối với nhau bởi giao thức 
truyền thông Internet (IP) và sử dụng một hệ thông địa chỉ 
thống nhất trên phạm vì toàn câu để cung cấp các dịch vụ 
và ứng dụng khác nhau cho người sử dụng”. 
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Intemet sử dụng bộ giao thức truyền thông TCP/IP (từ 
tiếng Anh là Transmission Control Protocol/Internet 
Protocol) làm chuẩn truyền thông của toàn mạng. 

Khi một mạng cục bộ (mạng LAN) sử dụng công nghệ 
của Internet trong hoạt động của mạng thì được gọi là mạng 
Intranet. 

a 1.2. Địa chỉ IP và địa chỉ tên miền 

Trên Internet có hàng triệu máy chủ được kết nối trên đó 
có vô vàn các tài nguyên thông tin được phân bố một cách 
phân tán. Để thông tin có thể được chuyển tải từ một máy 
này đến một máy khác một các chính xác, mỗi máy tính kết 
nối vào mạng nối vào mạng đều có địa chỉ và đó là địa chỉ 
duy nhất, không trùng lắp trên quy mô toàn cầu. Để đảm sự 
thống nhất và không trùng lấp đó, người ta đã thống nhất 
những quy tắc về xác định địa chỉ cho máy tính trên mạng. 

Địa chỉ trên mạng Internet có hai đặc trưng cơ bản là: 

- Tính đẳng cấp 

- Tính duy nhất 

Internet sử dụng hai loại địa chỉ có giá trị ngang nhau để 
xác định một máy chủ kết nối vào mạng: Địa chỉ IP và Địa 
chỉ tên miền. 

1.2.1 Địa chỉ IP 

Mỗi máy tính nối vào mạng Internet đều có một địa chỉ 
IP riêng và còn được gọi là địa chỉ Internet. Địa chỉ này là 
duy nhất toàn cầu cho mỗi máy tính nối mạng Internet. 
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Không thể có hai máy tính trên mạng lmteret có cùng một 
địa chỉ IP. Địa chỉ IP là địa chỉ dạng số, gồm có 4 nhóm số 
cách nhau bàng dấu chấm. Mỗi nhóm số có thể có giá trị từ 
0 đến 255. 

Ví dụ, địa chỉ máy Web chủ mạng VISTA của Trung 
tâm Thông tin Khoa học và Công nghệ Quốc gia là: 

192.168.2.2 

Bốn nhóm số này sẽ thể hiện cả máy chủ cụ thể cả mạng 
con mà máy chủ đó kết nối vào. Phản nhóm chữ số về mạng 
con là từ trái sang phải. 

Phần nhóm số cho mạng được Trung tâm Thông tin 
Mạng Intemet Quốc tế (InterNIC), theo uỷ quyền của Tổ 
chức Phân phối địa chỉ Internet - [ANA (Internet Assigned 
Numbers Authority), quyết định và gán cho nhà cung cấp 
dịch vụ Internet. Các nhà cung cấp dịch vụ xác định và gán 
phần nhóm số cho các máy trong mạng của mình. 

Lúc đầu các máy tính nối trên Internet đều sử dụng địa 
chỉ IP. Tuy nhiên việc định danh các phần tử của liên mạng 
bằng các con số như trong địa chỉ IP là không thuận tiện 
cho người sử dụng bởi chúng rất khó nhớ và đẻ gây nhầm 
lẫn. 

Để khác phục tình trạng này. người ta xây dựng một hệ 
thống địa chỉ tên miền (domain name) bằng chữ để dùng 
song song với hệ thống địa chỉ ÏP. 


1.2.2. Địa chỉ tên mềễn 
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Địa chỉ tên miền (domain name) là một dạng địa chỉ 
bàng chữ sử đựng để xác định một máy tính kết nối vào 
Internet. Địa chỉ này có tính đẳng cấp, duy nhất và có địa 
chỉ IP tương ứng. Địa chỉ tên miễn bao gồm một số cụm ký 
tự và phân cách nhau băng dấu chấm. 

Ví dụ về một số địa chi tên miền như sau: 

WWW,vm.vn 
WWw.vista.qov.vn 

Thông thường, trong địa chỉ tên miền có thành phần 
được gọi là "tên miền cấp cao" (top-level domain name). 
Với các mạng ngoài nước Mỹ, phần tên miền cấp cao gồm 
hai bộ phận: bộ phận xác định quốc gia và bộ phận xác định 
lĩnh vực hoạt động hoặc loại hình của tổ chức, cơ quan hoặc 
mạng. Miền cấp cao nhất là cấp quốc gia. Mỗi quốc gia 
được gán một mã tên miền riêng gồm 2 chữ cái. Ví dụ: 


Mã miền cấp quốc gia Nước 

vn Việt Nam 
du Ôxtralia 
ca Canada 
Ír Pháp 

jP Nhật Bản 
uk Anh 

ru Nga 
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đe Đức 
kr Hàn Quốc 
sự Singapore 


Trong từng quốc gia lại được chia thành một số miền 
cấp cao xác định lĩnh vực hoặc loại hình tổ chức và tiếp tục 
đị xuống các cấp thấp hơn. Bảng LÍ liệt kê một số mã tên 
miền cấp cao về lĩnh vực. 


Bảng 11: Một số miền cấp cao về lĩnh vực 


Dạng tổ chức 


Thương mại, doanh nghiệp, kinh 
doanh (Commerc1al) 


ldu  |GáedkE | 
Nhà nước 
Quân đội 

Các tổ chức khác 


com 
cdu 
£ 
lop | 
lối — — -vÌ Tài nguyên trên mang 


Ví dụ, sự phân cấp tên miền điển hình ở Việt Nam có thể 
được thể hiện ở hình 12. 
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Hình 12. Sơ đồ phân cấp đơn giản tên miễn điển hình ở 
Việt Nam 
Mỗi địa chỉ tên miền bao giờ cũng sẽ có một địa chỉ IP 
tương ứng. Ví dụ, địa chỉ tên miền của máy chủ Web của 
VISTA là: 


www.vis(a.gov.vn 


Còn địa chỉ IP tương ứng của Máy chủ Web của mạng 
VISTA BÀ: 


192.168.2.2 


Các máy tính và thiết bị trên Internet sử dụng địa chỉ IP 
để truyền đữ liệu. Vì thế trên Internet có một hệ thống dịch 
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vụ gọi là Hệ thống tên miền DNS (Domain Name SysIem) 
có chức nàng dịch tên miễn sang địa chỉ IP tương ứng để 
các trạm làm việc với máy chủ bằng cách dùng địa chi IP 
chứ không dùng tên nữa. 

3 1.Ÿ. Các dịch vụ cơ bản của Internet 

Internet là một kho thông tin phân tán khổng lồ và để 
khai thác nó. người ta tạo ra công cụ khác nhau. Những 
công cụ khai thác thông tin trên Internet bao gồm: 

~.__ TELNET (Đăng nhập từ xa) 

- __ FTP(Dịch vụ truyền tệp) 

- — Thư điện tử 

- __ ARCHIE (Tìm kiếm tệp) 

~  GOPHER (Tra cứu theo thực đơn) 

-__ WAIS - (Tìm kiếm thông tin theo chỉ số) 

- World Wide Web(WWW hoặc Web) 

Việc phân loại các địch vụ trên Internet chỉ có tính chật 
tương đối. Các dịch vụ trên Intemet có thể được phân loại 
thành các nhóm tuỳ thuộc vào các tiêu chí phân loại khác 
nhau. 

Nếu dựa vào thời gian xuất hiện, có thể chia các dịch dụ 
Internet thành: 

® Dịch vụ Internet thế hệ l: bao gồm các dịch vụ 
TELNET, FTP, thư điện tử, nhóm tin. Đây là những dịch vụ 
xuất hiện đầu tiên, từ khi xây dựng Internet. 
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e Dịch vụ Internet thế hệ 2: bao gồm các dịch vụ 
ARCHEIE, GOPHER và WAIS. Những dịch vụ này xuất 
hiện muộn hơn nhưng đang dần dần bị thay thế bằng dịch 
vụ thế hệ 3. 

e Dịch vụ Internet thế hệ 3: dịch vụ World Wide Webb, 
là dịch vụ mới nhất và bao quát nhất. Dịch vụ Web có khả 
năng bao quát tất cả các dịch vụ trước đó. 

Nếu đựa vào chức năng thông tin, có thể chia thành các 
nhóm: 

e Các dịch vụ lấy thông tín: gồm dịch vụ FTP và 
GOPHER. 

e Các dịch vụ tìm kiếm thông tin: gồm các dịch vụ 
WAIS và ARCHIE. 

e Các dịch vụ truyền thông: Dịch vụ thư điện tủ (E- 
mail) và TELNET. 

e Các dịch vụ thông tin đa phương tiện: World Wide 
Web 

World Wide Web, còn thường được viết tất là Web hay 
WWW, là một dịch vụ mới nhất và hấp dẫn nhất của 
Internet. Đó tập hợp khổng lồ dữ liêu trải trên hàng triệu 
máy tính tham gia vào mạng Intemet toàn cầu. Thậm chí 
nhiều người quan niệm World Wide Web và Intemet là 
một. Thực tế thì World Wide Wcb chỉ là một dịch vụ của 
Internet, nhưng lại là phần phát triển nhanh và được sử dụng 
nhiều nhất. Đây là một dịch vụ thông tin có khả năng tích 
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hợp trong nó tất cả các địch vụ khác của Internet như thư 
điện tử, FTP, GOPHER và WAIS. Vì vậy khi nói đến tìm 
tin trên Ïnternet, người ta thường tập trung chú ý đến các 
công cụ tìm tin trên Web. 

Những giới thiệu về quá trình hình thành phát triển cũng 
như các phương pháp tìm kiếm thông tin trên Web được 
trình bày chi tiết ở phần sau. 


2. WORLD WIDE WEB 
a 2.1. Một số khái niệm cơ bản của World Wride Web 


World Wide Web (sau đây viết tất là Web) dịch vụ 
Internet được xây dựng dựa trên một kỹ thuật trình bày dữ 
liệu có tên gọi là siêu văn bạn (hypericxU. Siêu văn bản có 
thể là một từ hoặc một câu xuất hiện trong các tệp điện tử 
và được liên kết với thông tin trong các tệp khác. Khi chọn 
siêu văn bản, màn hình sẽ tự động hiển thị các tệp và các 
thông tin liên kết với từ hoặc câu đó. Các thông tin liên kết 
đó có thể là văn bản khác, là hình ảnh, âm thanh, hình ảnh 
động hoặc là tổ hợp của các dạng đó. Người dùng có thể để 
đàng quay lại tệp chứa siêu liên kết gốc bằng cách sử dụng 
phím Back. Nếu có sản một siêu liên kết khác, người dùng 
có thể thực hiện ngay việc liên kết với Các trang mới. Nói 
cách khác, siêu văn bản biểu hiện qua cắc từ được chọn 
trong văn bản có thể được “mở rộng” bất kỳ lúc nào để 
cung cấp các thông tin đầy đủ hơn về các từ đó. Sự “mở 
rộng” ở đây được hiểu là chúng có các liên kết “links” tới 
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các tài liệu khác chứa những thông tin bổ sung. Siêu văn 
bản được phân biệt với văn bản thường bởi mầu sắc và kiểu 
dáng của nó. Phần mềm dùng để nối đến Web cài đặt trên 
máy trạm, gọi là bộ duyệt hay trình duyệt Web (Web 
Browser), sẽ xác định siêu văn bản đó có dạng như thế nào 
(thường là màu xanh và được gạch dưới, nói chung là một 
màu và một kiểu dáng độc nhất để dễ phân biệt với văn bản 
thông thường). 

Thuật ngữ và khát niệm siêu văn bản là do nhà tin học 
Tel Nelson đưa ra lần đầu tiên năm 1965 trong bài viết 
“Computer dreams” (những giấc mơ máy tính) bàn về ý 
tưởng tạo ra những máy tính có “trí tuệ nhân tạo”, có tư đuy 
như con người; trong đó ông đã đề cập đến khái niệm siêu 
văn bản và muốn cả thế giới có một hệ thống siêu văn bản. 
Đến năm 1980, Tim Bermers - Lee, một nhà nghiên cứu 
làm việc tại Viện Nghiên cứu Hạt nhân Châu Âu (CERN) - 
một tổ hợp phòng thí nghiệm vật lý hạt nhân đóng ở Thụy 
Sÿ đã giúp cho ý tưởng về siêu văn bản đầu trở thành hiện 
thực. Năm 1990, cùng với đồng nghiệp là Robert Cailliau, 
Tim Bemers-Lee đã bắt tay vào thực hiện đự án thiết kế 
mạng thông tin toàn cầu dựa trên khái niệm siêu văn bản. 
Thuật ngữ Worid Wide Web được dùng để mô tả dự án và 
được công bố lần đầu tiên vào tháng 8/1991. 

2.1.! Trang Web và HTML 

Web thực chất là một tập hợp các công cụ tiện ích và 
giao diện giúp người sử dụng có thể tự tạo ra các siêu văn 
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bản và cung cấp cho những người dùng khác trên Internet. 
Trang siêu văn bản như vậy thường được gọi là ”trang 
Web". Để soạn thảo các trang siêu liên kết người ta sử 
dụng công cụ Ngôn ngữ đánh dâu siêu văn bản thường 
viết tất là HTML (từ tiếng Anh HyperText Markup 
Language), do đó các trang Web còn được gọi là tài liệu 
siêu văn bản hay trang HTML. Ngôn ngữ HTML thực chất 
là một phần rúi gọn của ngôn ngữ đánh dấu văn bản chuẩn 
tổng quát SGML (Standard General Markup Language). 
HTML liên kết các kiểu dữ liệu khác nhau trên cùng một 
trang tài liệu như văn bản, đồ hoa, hình ảnh động, âm 
thanh. 

HIML là một ngôn ngữ định dạng (hay đánh dấu - 
markup). Mỗi tệp văn bản có chứa các mã đánh đấu gọi là 
các “thể” (tag) để dịnh dạng tài liệu hoặc tạo các siêu liên 
kết. Thẻ HTML là một đoạn mã được giới hạn bởi các dấu 
ngoặc nhọn “< ” và “ >”. Ví dụ mã đánh dấu bất đầu trang 
Web là <HTML> còn mã đánh dấu kết thúc trang Web là 
</HTML>. Các thẻ định dạng HTML luôn luôn đi theo 
cập. Một mã mỡ đầu đánh dấu đoạn cần định và mã đánh 
dấu kết thúc phần cần định dạng. Mã kết thúc gần giống với 
mã mở đầu, chỉ khác ở chổ có thêm I gạch chéo ở phần 
đầu. 

Ví dụ về một trang tài liệu HTML có thể như sau: 

<HIML> 

<HEAD> 


260 


BNG- 





<TTTLE>Vi dụ về trang HTML <ITITLE> 

</HEAD> 

<BODYV> 

<lj]> Đây là một trang Siêu văn bản đơn giản</HI> 

HTML là một <B>ngôn ngữ định dạng<!B> (hay đánh 
đấu - markup). <BR> 

Mỗi tệp văn bản có chứa các mã đánh dấu gọi là các thể 
(tag) để dịnh dạng tài liệu hoặc tạo các siêu liên kết <BR> 

</BODY> 

</HTML> 


Trong đó <HTML> thông báo bắt đầu trang HTML, 
</HTML> đánh dấu kết thúc trang HTML, <BODY> thông 
báo bắt đầu phần nội dung sẽ hiển thị trên màn hình còn 
</BODY> đánh dấu kết thúc phần này. 

Chương trình đọc trang HTML và hiển thị nó cho người 
đọc xem gọi là trình duyệt Web (Web Browswr). Trình 
duyệt Web sẽ đọc các thẻ khi thực hiện định dạng các tệp 
HTML trên màn hình. 

2.1.2 Định vị tài nguyên thống nhất - URL 

Để thực hiện việc truy nhập, liên kết các tài nguyên khác 
nhau của mạng Web theo kỹ thuật siêu văn bản, mỗi tài 
nguyên trên mạng, kể cả trang web, đều phải có địa chỉ trên 
Internet. Web sử dụng khái niệm định vị tài nguyên thống 
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nhất (có thể còn gọi là Định vị nguôn tin thống nhất), 
viết tát là URL từ thuật ngữ tiếng Anh Uniform Resource 
Locator) để xác định địa chỉ của một tài liệu. một dịch vụ, 
máy chủ,... trên Wcb. 

Cấu trúc tổng quát của một URL bao gồm các thành 
phần : 

Giao thức://địa chỉ máy chủ/đường dắn/tên tệp 

trong đó: 

- Giao thức cho biết loại gtao thức mà trình duyệt phải 
sử dụng để lấy ra tệp tín định trước. Những giao thức phổ 
biến được dùng trong các URL là: 


http giao thức truyền tệp siêu văn bản, truy cập tài nguyên 
trên máy chủ Web 

ftp giao thức truyền tệp, truy cập tài nguyên trên máy chủ 
truyền tệp (FTP) 


gopher giao thức gopher, truy cập tài nguyên trên máy chủ 
Gopher 

telnet g1ao thức telnet, thực hiện truy cập đến máy chủ từ xa 

file truyền tệp cục bộ, truy cập đến tệp tin trên máy cục 
bộ hoặc trên máy chủ truyền tệp 


wais giao LHÚC Wais, truy cập tài nguyên trên mấy chủ 
Wais 
news truy cập tài nguyên trên máy chủ quản lý nhóm tín 


{Usernet News) 
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Mặc dù tất cả các URL đều bất đầu bằng một giao thức, 
nhưng cách biểu diễn giao thức đó có thể thay đối. Tuy 
nhiên hầu hết các giao thức đều được biểu điển bằng dấu 
hai chấm và hai gạch chéo (://) ngoại trừ giao thức tin tức và 
địa chỉ thư là dùng dấu hai chấm (news:, mailto:) 

- Địa chỉ máy chủ: là thành phần đứng sau giao thức và 
là địa chỉ của máy chủ lưu trữ tệp tin. Địa chỉ máy chủ có 
thể là địa chỉ IP hay địa chỉ tên miền. 

Ví dụ địa chỉ máy chủ của mạng VISTA có thể là: 

‡92.168.1.2 
hay 
WWW.VISIA.ØOV.VII 

- Đường dân thư mục là thành phần đứng sau tên địa 
chỉ máy chủ. (directory path) để thòng báo đường dẫn đến 
thư mục lưu tệp tin. Một điểm cần chú ý là dấu “/ ” được sử 
dụng để chỉ ra các thư mục chứ không phải dấu “ VN” trong 
môi trường Windows hay DOS. 

- Tên tệp là thành phần sau cùng của một URL. Khi 
không có tên tệp thì trình duyệt Web sẽ sử dụng một tên 
mặc định do máy chủ Web cụ thể quy định (thông thường 
tên ngầm định là index.htm hoặc index.html). 

Để truy cập tới một trang Web nào đó ta có thể gõ trực 
tiếp URL của trang Web đó vào khung cửa số địa chỉ của 
trình duyệt Web trên máy trạm. Nếu trang Web có những 
siêu liên kết thì đằng sau mỗi siêu liên kết chính là một 
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URL sẵn sàng để được đưa vào sử dụng. Khi chọn một siêu 
liên kết, thực tế người dùng đã cung cấp một UIRL tương 
ứng với liên kết đó cho trình đuyệt của mình. Trình duyệt sẽ 
tiến hành các công đoạn tìm kiếm và hiển thị tệp có URL 
đã được xác định bởi lệnh siêu liên kết đó. 

a 2.2. Trình duyệt Web 

Hoạt động của Web đựa trên mô hình khách/chủ (tiếng 
Anh gọi là Cliem/Server). Các trang Web sẽ được cài đặt 
trên máy chủ Web (Web Server) và có thể truy cập được 
qua mạng Internet nhờ chương trình máy khách (trình 
duyệt). 

Để truy cập được các trang Wcb, trên máy trạm, người 
dùng cần một chương trình đặc biệt gợi là Trình duyệt 
Web (tiếng Anh gọi là Web Browser).. Trình duyệt Web 
là một chương trình máy khách thực hiện chức năng giao 
tiếp giữa người dùng và các tài nguyên từ xa lưu giữ trên 
các máy chủ Web với hai chức năng cơ bản: 

- liên lạc với máy chủ và gửi yêu cầu tìm kiếm các tệp 
html đến máy chủ Web ở xa trên mạng Internet dựa vào địa 
chỉ URL được khai báo; 

- Nhận thông tin từ máy chủ Web, biên địch các thẻ html 
và hiển thị nội dung các trang tài liệu nhận được. 

Trình duyệt Web có thể chia thành hai nhóm: 

- Trình duyệt văn bản; 

- Trình duyệt đồ họa. 
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Trình duyệt văn bản không có khả năng hiển thị đồ hoa, 
hình ảnh. hình ảnh động, âm thanh,.... Chúng chỉ cho phép 
người dùng xem được văn bản. Ví dụ về các trình duyệt văn 
bản là MOSAIC và LYNX. Đây là những loại trình duyệt 
thế hệ đầu tiên. 

Trình duyệt đồ hoạ thường có thêm các chương trình trợ 
giúp hoặc có khả năng tích hợp các crương trình này để cho 
phép người dùng hiển thị được hình ảnh, chạy các chương 
trình nghe âm thanh, xem hình ảnh động. Ví dụ về những 
trình duyệt đỏ hoạ là Netscape Navigator của Netscape, 
Internet Explorer của Microsoft, Web Access của Novell, 

na 2.3. Nguồn tin trên Worid Wide Web 

Nguồn tin trên Web rất phong phú và đa dạng. Chúng ta 
có thể xếp các loại thông tin trên Web thành các nhóm như 
Sau: 

- Các tài liệu điện tử: có hàng tỷ trang Web về mọi lĩnh 
vực khác nhau được đưa lên mạng. Mọi loại hình tài liệu 
nếu được chuyển đổi sang dạng số (điện tử) hoặc là dạng số 
ngay từ khi được tạo ra đều có thể lưu trữ trên Web và có 
thể truy cập được bởi người truy cập Internet. Những tài 
liệu này có thể là các tệp văn bản ở những khổ mẫu khác 
nhau (HTML, Word, văn bản thuần tuý, PDF, Postscript....). 
các tệp ảnh (ảnh GIF, TTIFF, Bitmap, PNG,...); tệp âm thanh, 
tệp đồ hoạ, tệp hình ảnh động; 

- Phản mềm máy tính: Trên Web, người sử dụng 
Internet có thể truy cập và tải về nhiều phần mềm máy tính. 
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Một số phần mềm là loại không mất tiền (Freeware), một số 
khác là loại có thể sử dụng cho mục đích đánh giá và dùng 
trong một thời gian hạn chế (thường gọi là Shareware). Các 
phần mềm này rất đa dạng, từ phần mềm hệ thống, phần 
mềm tiện ích đến phần mềm ứng dụng; 

- Tạp chí điện tứ: với sự phát triển của Web, nhiều tổ 
chức đã xuất bản các tạp chí và đưa lên mạng để mọi người 
khai thác, sử dụng. Tạp chí điện tử là một nguồn tin vô 
cùng quan trọng trên Wcb. Tạp chí điện tử có thể là dạng 
điện tử của tạp chí được xuất bản trên giấy hoặc trên vật 
mang tin khác. Trong nhiều trường hợp tạp chí điện tử 
không có bản tương tự trên giấy mà chỉ có ở dạng điện tử 
mà thôi. Nhữn: :ạp chí điện tử không có phiên bản trên 
giấy còn được gọi theo tiếng Anh là E-zines hoặc E- 
Journals. Cùng với các tạp chí điện tử, còn có rất nhiều các 
báo điện tử cung cấp tín tức và nhiều thông tin khác. Về nội 
dung, các tạp chí điện tử có thể không khác với phiên bản 
trên giấy, tuy nhiên điểm vượt trội của tạp chí điện tử là nó 
có các siêu liên kết cho phép kết nối tài liệu hiện tại với các 
tài liệu khác. Ngoài ra tạp chí điện tử có ưu điểm rất lớn là 
dễ phổ biến và bảo quản dễ dàng; l 

- Dịch vụ thông tin trực tuyến: Ngày nay tất cả các nhà 
cung cấp dịch vụ thông tin trực tuyến thương mại đều đã 
cung cấp dịch vụ của mình thông qua Web. Ngoài ra còn rất 
nhiều dịch vụ trực tuyến miễn phí được các tổ chức xây 
dựng và cung cấp cho người sử dụng; 
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- Các cơ sở dữ liệu: Nhiều tổ chức đã xây dựng các cơ 
sở dữ liệu và đưa chúng lên mạng để người dùng tin khai 
thác. Một số cơ sở dữ liệu có thể là miễn phí trong khi một 
số cơ sở dữ liệu thì chỉ hạn chế cho những người sử dụng có 
đăng ký. Những cơ sở dữ liệu này rất đa dạng, có thể là thư 
mục, dữ kiện hoặc toàn văn; 

- Các mục lục thư viện trực tuyến: Ngày nay hầu hết 
các thư viện đều đưa các mục lục thư viện của mình lên 
Web để người sử dụng truy cập, tìm tin và khai thác kho tài 
liệu của thư viện của mình. 


3. TÌM TIN TRÊN WEB : 

Intemet là một kho dữ liệu khổng lồ, đa dạng, không có 
khổ mẫu thống nhất, không được sắp xếp và quản lý theo 
một thể thức thống nhất. Vì thế để tìm được thông tin trên 
Internet đòi hỏi phải có những công cụ và phương pháp phù 
hợp. Do sự phát triển có tính chất bùng nổ của dịch vụ Web, 
nên đôi khi việc tìm tin trên Ínternret được coi là đồng 
nghĩa với tìm tin trên Web. 

Phương pháp tìm tin là cách thức thực hiện việc tìm tin. 
Trên Web, có thể áp dụng 2 phương pháp tìm như sau: 

- Phương pháp tìm tin bằng từ khoá; 

- Phương pháp tìm theo chủ đề. 

Phương pháp tìm tin bằng từ khoá là cách thức tìm tin sử 
dụng những từ khoá và máy tìm tin để tìm ra những thông 
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tin phù hợp với yêu cầu tìm kiếm. Tìm tin bằng từ khoá trên 
Web có thể coi như tương đương với việc tra cứu mục lục 
trực tuyến cuả một thư viện khổng lồ. 

Phương pháp tìm theo chủ đẻ sử dụng những danh bạ 
chủ để (đôi khi được gọi là danh bạ chủ để) (subject 
directories) được xây dựng đặc biệt để quản lý nguồn tin 
trên Wcb và cung cấp khả năng truy cập đến chúng. 
Phương pháp tìm theo chủ đề có thể được coi là tương tự 
như sử dụng hộp phiếu mục lục thư viện. 

Công cụ tìm tin trên Internet bao gồm một số loại cơ 
bản. Dựa vào phương pháp tìm tin, người ta có thể chia các 
công cụ tìm tin rên Web thành các nhóm: 

- Máy tìm tin (Search engine): sử dụng để tìm tin bằng từ 
khoá 

- Danh bạ chủ để (Subject directory): sử dụng phương 
pháp liệt kê theo chủ đề. 

- Hướng dân chuyên môn hoá (Subject guide): sử dụng 
phương pháp liệt kê để tìm tin. 

- Cơ sở đữ liệu 

Hiện nay, nhiều danh bạ chủ để đều có các máy tìm tin 
riêng cho cơ sở dữ liệu về trang Web của mình. Ngược lại, 
những máy tìm tin cũng có danh bạ chủ đề đơn giản giúp 
người dùng tin tra cứu một số thông tin theo phương pháp 
liệt kê. 
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a1 3.1. Máy tìm tin 

Máy tìm tin là một chương trình tìm cho phép người sử 
dụng dùng các từ khoá (keyword) để tìm kiếm trong những 
cơ sở đữ liệu về trang web. Máy tìm tin bao gồm một cơ sở 
dữ liệu chứa các chỉ dẫn về hàng triệu trang web trên 
Internet và công cụ tìm kiếm. Người tìm tin giao tiếp với cơ 
sở dữ liệu, gửi yêu cầu tìm dưới dạng các từ khoá để "hỏi" 
cơ sở dũ liệu. Kết quả của lệnh tìm sẽ là những trang web 
có chứa các siêu liên kết tới những trang web thoả mãn yêu 
cầu của lệnh tìm. Có hàng trảm máy tìm tin như vậy trên 
toàn mạng Web. Để sử dụng được máy tìm tin, người sử 
dụng phải biết địa chỉ URL của máy và để truy cập trang 
Web đó bằng trình duyệt Web. 

Máy tìm tin có thể được chia thành hai loại: 

- Máy tim tin đơn 

- Máy siêu tìm tin 

3.1.1. Máy tìm tin đơn 

Trên Web có hàng trăm máy tìm tin. Đôi khi máy tìm tin 
còn được gọi là động cơ tìm kiếm. Máy tìm tin cung cấp 
một giao diện tương tác giữa người tìm tin và cơ sở đữ liệu 
của máy tìm tín. Đặc điểm cơ bản của máy tìm tin đơn là 
việc tìm tin được thực hiện với cơ sở dữ liệu về trang Web. 
Phần lớn các cơ sở dữ liệu của các máy tìm tin về trang 
Web thường được tạo ra một cách tự động bởi những 
chương trình đặc biệt. Các chương trình này được gọi bằng 
những tên khác nhau như "con nhện” (spiders), người 
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máy” (robots), Crawler,.... Đó là những chương trình máy 
tính được thiết kế đặc biệt để thu thập thông tin về các trang 
Web và tạo ra cơ sở đữ liệu về chúng. Môi máy tìm tin đều 
có biểu mẫu (FORM) để nhận yêu cầu tin. Yêu cầu tìm là 
những từ khoá, cụm từ, hoặc những điều kiện tìm kiếm mà 
máy tìm tin tin cung cấp. 

Dựa trên một sự kết hợp giữa các từ khoá, máy tìm tin sẽ 
tìm thông tin về tài liệu Web từ cơ sở đữ liệu về trang Web. 
Cần lưu ý rằng khi sử đụng máy tìm tin, chúng ta không tìm 
kiếm trực tiếp những thông tin trong Internet như nó đang 
tồn tại ở thời điểm đó, mà tìm kiếm những cơ sở dữ liệu cố 
định. Chúng đã đợc tạo ra từ trước (bởi các "con nhện” hay 
"người máy” ). 

Đặc điểm chung của các máy tìm tin là việc định chỉ số 
cho các trang web để đưa vào cơ sở đữ liệu được thực hiện 
tự động dựa trên toàn văn tài liệu HTML, không có phân 
loại theo chủ đề. 

Hiện trên Web có hàng trăm máy tìm tin khác nhau. Do 
mỗi máy thực hiện công việc tìm tin theo các cách khác 
nhau nên cùng một yêu cầu tin, các máy tìm tin khác nhau 
sẽ đưa ra những kết quả khác nhau. Các yếu tố ảnh hưởng 
đến kết quả tìm được bao gồm: 

- Kích thước (độ lớn) của cơ sở dữ liệu; 

- Tính thường xuyên cập nhật thông tin; 

- Các khả năng tìm kiếm. 
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Hình 13. Trang chủ máy tìm tin AlaVisia 

Những máy tìm tin cũng khác nhau trong tốc độ tìm 
kiếm, trong cách thiết lập giao diện tìm kiếm, cách hiển thị 
kết quả và khốt lượng hướng dẫn (he]p) đưa ra. 

Ưu điểm cơ bản của máy tìm tin là mức độ cập nhật 
nhanh hơn danh ba chủ đề do sử dụng các công cụ tự động 
trong việc xây dựng cơ sở dữ liệu. Do sử dụng công cụ tự 
động, các cơ sở dữ liệu về trang Web của máy tìm ttn 
thường lớn (hàng chục triệu đến hàng trăm triệu biểu ghi), 
mức độ bao quá cao hơn, kết quả tìm kiếm thường đầy đủ 
hơn. Máy tìm tin được sử dụng hiệu quả hơn đốt với các câu 
hỏi có tính đặc thù, chuyên sâu. 
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Máy tìm tin cũng có những nhược điểm. Do không có 
khả năng kiểm soát trở lại các liên kết nên nhiều trang Web 
đã không còn trên mạng nhưng vẫn có trong cơ sở đữ liệu, 
vì thể đôi khi dẫn đến kết quả tìm không đúng với thực tế. 
Do việc sử dụng phương pháp định chỉ số tự động nên mức 
độ nhiều cao. Kết quả tìm tin nhiều khi rất lớn (hàng triệu 
biểu ghi), nên gây khó khăn cho việc lựa chọn kết quả phù 
hợp. 

Để giải quyết vấn đề đưa nhiều kết quả không phù hợp, 
các máy tìm tìn thường cung cấp khả năng xếp hạng biểu 
phi theo mức độ phù hợp với yêu cầu tìm. Thông thường 
những biểu ghi có độ phù hợp cao hơn được trình bày đầu 
tiên. Tiêu chí x‹›› nạng không hoàn toàn như nhau giữa các 
máy tìm tin. 

Có thể nêu một số ví dụ về máy tìm tin như sau: 

e®. VinaSeek (http://www.vIinaseek.com) 

® _ PanVietnam (htIp://Www.panvietnam.com/) 

® Gooplc (http:/www.google.com/ 

® AltaVista ( hup://altavista.digital.com ) 

e® Excite ( http:/www.excite.com ) 

e_ HotBot ( http: //www.hotbot.com) 

®_ Infoseek ( http://www.infoseek.com) 

e_ Northem Light ( http:/www.northernlight.com) 
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3.1.2. Máy siêu tìm tín 

Do số lượng các máy tìm tin tăng nhanh và cánh thức 
tìm kiếm cũng đa dạng, đã dẫn tới sự ra đời của những 
"siêu” công cụ tìm kiếm (“meta” search tools), được gọt là 
những máy siêu tìm tin (metasearch engines) hay máy tìm 
tin đa mạch (Multi-threaded search engine). Máy siêu tìm 
là một giao điện đặc biệt cho phép người tìm chỉ một lần 
nhập từ khoá có thể tìm kiếm đồng thời cùng lúc nhiều loại 
cơ sở dữ liệu của một số máy tìm tin khác nhau. 

Điểm khác biệt cơ bản về cơ chế tìm tin giữa máy tìm tin 
đơn và máy siêu tìm tin là máy siêu tìm tin không có cơ sở 
dữ liệu về trang Web của chính mình. Chúng chỉ là một 
giao diện, nhận yêu cầu tìm và gửi chúng tới những máy 
tìm tin bình thường có cơ sở dữ liệu riêng để xử lý và nhận 
lại kết quả. Hình 14 giới thiệu quan hệ giữa máy tìm tin đơn 
và máy siêu tìm tin. 

Nhược điểm của máy siêu tìm tin là chúng không có 
được mức độ kiểm soát hay khả năng kết hợp cao trong việc 
xây dựng biểu thức tìm như với giao diện tìm kiếm và logic 
tìm kiếm của các máy tìm tin đơn. Tuy nhiên chúng có ưu 
điểm là nhưng phần lớn máy siêu tìm tin chạy rất nhanh, có 
một số tính năng như khả năng phân loại sắp xếp kết quả 
theo địa chỉ (site), theo loại nguồn tin, theo miền (domain), 
khả năng lựa chọn các máy tìm tin, khả năng sửa đổi các 
kết quả, loại bỏ trùng lặp. 
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CSDL trang CSDI, trang | CSDL, trang 
Web ] ị Web 2 Web 


Hình I 4. Quan hệ giữ máy siêu tìm tin và máy tìm tin dơn 


Ví dụ về một số máy siêu tìm tin như: 

® . Dogplle (http:/www.dogpilc.com) 

®  Inference Find (hitp://www.inference.com/infind/) 

® - Meta Crawler (htip://www,metacrawler.com}) 

®  Profusion (http://prufusion.iitc.ukans.edu/) 

3.1.3. Chế độ tìm tin của máy tìm tin 

Thông thường các máy tìm tin có hai chế độ tìm: tìm cơ 
bản (hay tìm đơn giản) và tìm nâng cao (tìm phức hợp). 
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Thuật ngữ chỉ các chế độ tìm có thể khác nhau với những 
máy tìm tin khác nhau. 

Trong chế độ tìm cơ bản, người tìm không sử dụng toán 
tử mà thường chỉ sử dụng các từ riêng rẽ, tên riêng hoặc 
cụm từ. Các từ được viết vào cửa số câu hỏi sẽ được kết 
hợp theo phương thức ngâm định. Tuỳ theo máy tìm tin, 
phương thức kết hợp ngầm định có thể là AND hay là OR. 

Để tìm chính xác theo cụm từ người dùng nên sử dụng 
dấu ngoặc kép “ “. Điều này sẽ giúp giảm số trang tìm 
được, nâng cao tính chính xác của kết quả tìm tin (xem 
phần toán tử). 

Để đạt kết quả tìm chính xác, đặc thù phải sử dụng tính 
năng tìm nâng cao. Mỗi máy tìm khác nhau có thể có các 
tên khác nhau cho chế độ tìm nâng cao: Advanced Search 
(với AltaVista), Power Search (với Excite), Super Search 
(với HotBot)... 

Trong tìm nâng cao phải sử dụng các toán tử, các tiền tố 
để xác định tìm giới hạn trong trường. 

3.1.4. Phương thức tìm tin: 

Tương tự như tìm tín tự động hoá, các máy tìm tin có 
thể sử dụng những phương thức tìm tim khác nhau. Có thể 
phân biệt một số phương thúc chính sau: Toán tử boole 
(AND, OR, NOT); Dấu cộng/ trừ (+ hoặc -); Cụm từ trong 
dấu ngoặc kép “ “; Chặt cụt (Truncation); Phân biệt chữ 
hoa/ chữ thường; Tìm hạn chế theo trường 


3.1.4.1. Toán tử boole 
Toán tử boole là các quy tắc hoặc các lệnh đặc biệt sử 
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dụng để tạo sự kết hợp giữa các từ khoá trong câu hỏi nhằm 

đạt được sự tìm kiếm có kết quả chính xác và đúng yêu cầu 

hơn. Tương tự như tìm tm tự động hoá, các máy tìm tin có 

thể sử dụng những ký hiệu khác nhau để thể hiện các toán 

tử boole chính AND, OR, NOT và NEAR. 

AND.. Toán tử yêu cầu bai từ phải cùng có mặt trong tài liệu. 

OR Toán tử đòi hỏi phải có ít nhất một trong hai từ phải có 
trong tài liệu. 

NOT Toán tử yêu cầu từ đứng sau toán tử phải không có trong 
tài liệu 

NEAR Toán tử yêu cầu hai thuật ngữ phải gần nhau hoặc cách 
nhau một số từ nhất định trong biểu ghi. 

Một điểm cần lưu ý là mỗi máy tìm tin đều có toán tử 
ngầm định riêng. Đa số các máy tìm tin sử dụng AND là 
toán tử ngầm định khi viết hai thuật ngữ tìm sát nhau. 

Một số máy tìm tin còn sử dụng cả toán tử lân cận 
NEAR. Khi có toán tử NEAR, máy tìm tin sẽ chỉ tìm ra 
những tài liệu có hai từ trong biểu thức tìm cách nhau một 
số từ nhất định. 

3.1.4.2. Dấu cộng (+ )/ dấu trừ ( -) 

Dấu cộng (+) và đấu trừ (-) là những toán tử thông dụng 
của nhiều máy tìm tin trên Internet. 

Khi đậi dấu cộng (+) trước một từ trong biểu thức tìm, 
thì máy tìm tin sẽ yêu cầu tài liệu tìm được phải có chứa từ 
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đó. Toán tử này có tác dụng tương đường toán tử AND. Chú 
ý không được đặt khoảng trống giữa dấu cộng (+) và từ. Ví 
du: 


information +technology 


Khi đặt dấu trừ (-) ở trước một từ thì thì máy tìm tin sẽ 
yêu cầu tài liệu tìm được phải không chứa từ đó. Toán tử 
này có tác dụng tương đương toán tử NOT. Chú ý rằng 
không được đặt khoảng trống giữa dấu trừ (-) và từ. Ví dụ: 


information -technolosy 


3.1.4.3. Dấu ngoặc kép " " 

Khi những từ được đặt giữa hai dấu nháy kép thì chúng 
sẽ được xử lý như một cụm từ chính xác. Khi viết một biểu 
thức tìm có nhiều từ, nếu không có dấu ngoặc kép, máy tìm 
tin có thể áp dụng kết hợp ngầm dịnh giữa các từ đó. Vì vậy 
để đảm bảo tìm chính xác hơn, cần sử dụng dấu nháy kép. 
Vị dụ: 


"search tutorial for beginers” 
3.1.4.4. Dấu chật cụt (Truncation) 
Kỹ thuật sử dụng dấu chặt cụt để mở rộng kết quả tìm tin 
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cũng được áp dụng đối với nhiều máy tìm tin tương tự như 
trong tìm tin tự động hoá. 

Chặt cụt là kỹ thuật mà ở đó người tìm tin sử dụng một 
ký hiệu chặt cụt được quy định cho máy tìm tin đặt phía 
cuối của thuật ngữ của thuật ngữ tìm làm cho hệ thống sẽ 
tìm ra những biểu ghi có chứa những thuật ngữ có phần gốc 
của từ trùng với phần ở trước ký hiệu chật cụt. 

Dấu chặt cụt rất có tác dụng trong việc tìm ra những từ 
có cách viết khác nhau (color, colour) hoặc những từ có 
chung gốc (có cấu tạo gốc giống nhau, ví đụ: psychology, 
psychological, psychologist, psychologists ...). 

Ở những máy tìm in khác nhau, ký tự chặt cụt được quy 
định khác nhau. Nó có thể là: *, #, ?. Một vài máy tìm chỉ 
cho phép chặt phải (psycholog*), trong khi các máy khác 
lại có thể cho phép chặt giữa (colo*r). 

Không phải tất cả các máy tìm tin đều hỗ trợ kỹ thuật 
chặt cụt này. 

3.1.4.5 Phân biệt chữ hoa/ chữ thường 

Do máy chủ nối mạng Intermet sử dụng rất nhiều hệ điều 
hành mạng khác nhau nên có hiện tượng có sự phân biệt 
giữa dùng chữ thường và chữ viết hoa trong biểu thức tìm. 
Những hệ thống như vậy sẽ cho kết quả khác nhau khi dùng 
chữ thường và chữ in hoa làm câu hỏi tìm tin. 

Trong những trường hợp có sự phân biệt chữ hoa và chữ 
thường, nguyên tắc xử lý chung của các máy tìm tin như 
Sâu: 


278 





- Nếu sử dụng chữ thường để tìm tin, thì những biểu ghi 
có thuật ngữ như vậy nhưng viết hoa đều được chấp nhận 

- Nếu sử dụng chữ hoa để lập biểu thức tìm thì chỉ biểu 
ghi có chứa thuật ngữ được viết hoa như trong yêu cầu tìm 
mới thoả mãn yêu cầu tìm. 

Ví dụ nếu chúng ta sử dụng máy tìm tin AltaVista để tìm 
tin, kết quả tìm bằng biểu thức "information technology" sẽ 
khác với kết quả tìm của biểu thức tìm "INFORMATION 
TECHNOLOOY” hoặc "Information Technology". Kết quả 
tìm tin của biểu thức "information technology" sẽ bao quát 
cả kết quả của biểu thức tìm tin "INFORMATION 
TECNOLOGY”, nhưng không phải là ngược lại. 

Sử dụng chữ hoa khi viết biểu thức tìm có hiệu quả cao 
khi tìm theo tên người, tên cơ quan/tổ chức,,... 

3.1.4.6. Tìm giới hạn theo trường 

Mặc dù các trang Web không được cấu trúc hoá như. 
những biểu ghi của cơ sở dữ liệu, để nâng cao hiệu quả tìm 
tin, đảm bảo thực hiện được một số yêu cầu đặc biệt, các 
máy tìm tin cũng cung cấp khả năng tìm tin hạn chế theo 
trường. 

Phương pháp tìm giới hạn theo trường thường là sử dụng 
một số tiền tố đặt trước từ khoá tìm tin. Quy tắc chung khi 
viết yêu cầu tìm theo trườngnhư sau: 

Tiêntố: từ khoá 


trong đó: 
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- Tiên tố là mã gán trước từ khoá xác định sẽ tìm giới 
hạn theo trường đó 

- Từ khoá: là từ khoá sử dụng để tìm tin 

Với những máy tìm tin khác nhau thì tiền tố cũng khác 
nhau. Những trường được sử dụng trong tìm giới hạn theo 
trường có thể khác nhau trong từng máy tìm tin. 

Ví dụ máy tìm tin AltaVista cho phép tìm giới hạn theo 
một số trường như trình bày trong bảng 


Bảng I2. Tiên tố sử dụng trong tìm theo 
trường của AltaVista. 


Ví dụ lệnh tìm |ýngh: 

Tìm trang WEB có tử khoá. 

cụm từ nằm trong phần văn 

bản của siêu liên kết 

{ví dụ Click here tơ Visit 
AMtaVista 


domain:vn Bemm em 


domain:gov.vn Tim các trang WEB nằm trong 
một miền (domain). 

(tim trang web có domain 
name chứa cụm từ vn, gov.vn} 
















anchor:AltaVista 
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Tìm các trang WEB nằm trong 
mội máy chủ nào đó 

(tìm trang web chứa trên máy 
chủ aitavista.digital.com) 















link:anu.gov.au Tìm các trang WEE có liên kết 
đến một trang WEB được ghi 
trong phần văn bản sau tù 


khoá LINK 









Tim các trang WEB có chứa 
tùe khoá trong phần thân văn 
bản 


Tìm trang WEB có từ khoá 


trong câu hỏi nằm trong vùng 
, nhan để 
| Tìm các trang WEB có những 
từ trong câu hỏi nằm trong 
vùng địa chỉ URL 





Máy tìm tn 2 Vinaseek của Việc Nam 
(http://www.vinaseek.com}) hoặc PanVietnam 
(http:/www..panvietnam.com) cũng hỗ trợ tìm kiếm giới 
hạn theo trường. Ví dụ về các tiền tố dùng trong tìm kiếm 
giới hạn trong trường của Vinaseek trình bày trong bảng 13. 


Bảng 13. Các tiền tố dùng trong tìm kiếm của 


Vịinaseek 















“thị trường chứng 
khoán" 


Nếu không đề rõ trường tìm 
kiếm, mặc định sẽ là tìm trong 
toàn bộ nội dung văn bản, bao 
gồm cả tiêu đề và tóm tắt. 


Có chứa liên kết siêu văn bản lnk:tinhvan.com.vn 
bên trong nội dụng văn bản jwns 


Site: Tìm các văn bản trên máy chủ site:vinaseek.com 
có địa chỉ site 


URL của văn bản tìm được 
heln 


title: Tìm trong Tiêu đề của văn bản tile:"bản tìn nhanh” 
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Tổng hợp một số tính chất hỗ trợ tìm tin của một số máy 
tìm tin được trình bày trong bảng 14. 


Tìm tin bằng từ khoá thường thực hiện khi có yêu cầu 
tin đặc thù, không chung chung. Để tìm tin hiệu quả, 
cũng cần có chiến lược phù hợp. 

Tìm hiểu sơ bộ máy tìm tin; 

Tìm hiểu yêu cầu/câu hỏi; 

Xác định các khái niệm quan trọng của yêu cầu; 

Xác định từ khoá để mô tả khái niệm; 

Nhập yêu cầu ủm. Lúc đầu không nên sử dụng các 
kết hợp phức tạp mà chỉ dùng 2-3 từ khoá; 

Sử dụng dấu "...." để thể hiện những cụm từ; 

Lúc đầu nên sử dụng chữ thường vì cho kết quả cao 
hơn. Nhưng nếu biết chính xác thì nên sử dụng chữ 
hoa vì cho kết quả chính xác hơn (next, neXt,..) 

Để nâng cao tốc độ tìm tin theo từ khoá nên đánh dấu 
lưu địa chỉ các máy tìm tin (dùng FAVORTES của 
Explorer hoặc BOOKMARK của Netscape). 


Thường xuyên xem lướt hướng dẫn (HELP) vì các mấy 
tìm tin được cải tiến liên tục 
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Bảng 14. Tính năng của một số máy tìm tin 





Ghi chú: x: là có tính năng đó 
bỏ trống là không có khả năng đó 

j 3.2. Danh bạ chủ đề 

Ngoài phương pháp tìm kiếm dùng từ khoá, trên Web 
còn có một loại công cụ khác để tìm trn gọi là Danh bạ chủ 
đề (tiếng Anh là Subject Directory). Danh bạ chủ để là một 
chỉ mục có tổ chức về các nguồn tin có trên Web. Có thể so 
sánh Danh bạ chủ đề với các bảng mục lục chủ đề của thư 
viện. Đây là phương pháp tìm tin theo kiểu liệt kê, truy cập 
theo các đề mục chủ đề có tính thứ bậc. Thông thường việc 
tìm kiếm bắt đầu bằng một để mục chủ đề chung nhất, sau 
đó đi sâu (thu hẹp) dần đến những chủ để hẹp và chuyên 
hơn. Vì vậy có thể coi đây là phương pháp tìm theo chủ đẻ. 

Việc sắp xếp các chủ đề theo thứ bậc, cho phép người sử 
dụng biết được vị trí các chủ để trong Web nhằm tìm kiếm 
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những thông tin cần thiết (xem hình I5). Hình 15 là ví dụ về 
một số lớp đề mục chủ đề của Yahoo. Khác với các cở sở 
dữ liệu về trang Web của máy tìm tin, các danh bạ chủ đề 
được tạo ra và duy trì bởi con người. 

Khác với tình trạng vẻ hệ thống phân loại sử dụng trong 
thư viện (chỉ có một số hệ thống phân loại), không sự thống 
nhất về hệ thống phân loại chủ đề trên Web. Mỗi danh bạ 
chủ đề sử dụng hệ thống phân loại riêng của mình. Điều 
này gây khó khăn cho việc sử dụng, bởi người dùng tin phải 
tìm hiểu kỹ từng danh mục mới có thể khai thác chúng hiệu 
quả. 

Ngoài ra, đo các danh bạ chủ để được xây dựng và duy 
trì bởi con người nên chúng thường có quy mỏ nhỏ hơn cơ 
sở đữ liệu của máy tìm tin, không bao quát được toàn bộ 
Web, kết quả tìm thường ít hơn. 

Tuy nhiên do danh mục được xây dựng bởi chuyên gia, 
được chọn lọc và đánh giá cẩn thận về tính phù hợp với chủ 
đẻ nên tuy kết quả tìm đưa ra thấp hơn, song mức độ phù 
hợp với yêu cầu cao hơn. Hơn nữa, do đặc trưng chịu ảnh 
hưởng của người sử dụng. danh bạ chủ đề giảm một cách 
đáng kể việc lấy ra những kết quả không cần thiết. 

Thông thường máy tìm tin lập chỉ mục tất cả các trang 
Wcb của một Web site nhất định trong khi danh bạ chủ đề 
thường chỉ tạo ra một mối liên hệ duy nhất với trang chủ 
(home page) của Website đó. 


284 





001/0A 02 ậP †!4J2 0s 1044 đp2 tpt(d 0p 0 2A ñP 1A "CỊ tƒM1HJ 














aogatos [81aog 








92Wo1ac 19u493ưI 123nduIo 


UI09ˆ00Á" AA2aAA//:đ11 
OOHVA 


285 


Để tìm tin theo danh bạ chủ để, người tìm phải truy cập 
trang chủ của danh mục chủ đề đó. Tìm kiếm trên Web 
bằng đanh bạ chủ đề có ưu điểm là thông tin do được sắp 
xếp vào chủ để bởi các chuyên gia nên kết quả đưa ra 
thường chính xác. Tuy nhiên nó có nhược điểm là độ lớn 
của cơ sở dữ liệu thường bị hạn chế (nhỏ) và cập nhật chậm 
hơn. 

Bởi vì các danh bạ chủ đề được sắp xếp theo phân loại và 
chúng dễ dàng quay lại những kết nối với cấp cao nhất (top 
- level) của một Web site hơn là với những trang riêng biệt 
nên chúng phù hợp với việc tìm kiếm thông tin về một chủ 
để chung chung '.n là một mảng thông tin cụ thể. 

Rất nhiều trong số danh bạ chủ để có một máy tìm tin 
riêng phục vụ cho việc tìm kiếm cơ sở đữ liệu riêng. Các cơ 
sở dữ liệu của đề mục chủ đề thường nhỏ hơn cơ sở dữ liệu 
của các máy tìm tin, tức là những danh sách kết quả đưa ra 
cũng nhỏ hơn. 

Một số ví dụ về danh bạ chủ đề bao gồm: 

Yahoo (http://www.yahoo.conU) 
Galaxy (http://www.einet.nef) 
Look Smart (http://www.looksmart.com) 


Mapgcllan (http://www.mekinley.com) _ 
a 3.3. Hướng dân chủ đề chuyên môn hoá: 
Đo Web chứa một khối lượng thông tin khổng lồ nhưng 
vô cùng đa dạng, khác nhau về lĩnh vực và chủ đề, cộng 
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thêm sự phát triển rất nhanh chóng và thay đổi thường 
xuyên, việc nắm bắt một cách cập nhật những thông tin 
quan trọng trong mọi chủ đề là điều không thể làm được với 
một vài người. Do đó những danh bạ chủ đẻ chung như 
Yahoo chỉ có thể bao quát những lĩnh vực chung nhất mà 
thôi, trong khi các chuyên gia có thể cần thông tin đầy đủ 
hơn về lĩnh vực hẹp mà họ quan tâm. Để giải quyết vấn đề 
này, người ta tạo những Hướng dẫn chủ đề chuyên môn 
hoá (Specialized Subject Guide). Đó là một hướng dẫn đã 
được soạn ra bởi một số chuyên gia trong lĩnh vực cụ thể để 
tiếp cận những nguồn tài nguyên quan trọng thuộc lĩnh vực 
chuyên môn mà họ quan tâm đặc biệt. 

Những Hướng dẫn chủ để chuyên môn hoá là những 
trang web chứa tập hợp những liên kết tới những thông tin 
cần thiết hiệu quả hơn về một chủ để hẹp so với danh bạ 
chủ để chung chung. Những hướng dẫn như vậy có thể tồn 
tại trong hầu hết mọi chủ đề. 

Tương tự như những máy siêu tìm tin cho phép ầm đồng 
thời một số máy tìm tin khác nhau, một vài Web site đóng 
vai trò như những "Thư viện" hoặc những “Trung tâm chỉ 
dẫn” về các Hướng dẫn chủ để chuyên môn hoá. Các site 
này thực hiện việc xem xét, kiểm tra lại cũng như đưa ra 
những chú giải cho các danh bạ chủ đề mà nó chứa đựng, và 
phần lớn công việc dựa trên nguyên tắc cho phép các 
chuyên gia chủ đề duy trì các danh bạ chủ để chuyên môn 
hoá cá nhân. Một vài "Trung tâm Chỉ dẫn" như vậy xây 
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dựng các hướng dẫn chủ đề chuyên môn hoá ngay tại Web 
site của nó, trong khi một số khác lại chỉ chí dẫn các liên 
kết tới những hướng dẫn đặt tại nhiều site khác ở xa. 

Một số ví dụ vẻ điểm chỉ dân như vậy có thể là: 

- Argus Clearinghouse (http://www.clearinphouse.net) 

- The Mining Company (http://www.miningco.com) 

- WWW Virtual Library 
(http://vlib.stanford.edu/overview.html) 

n 3.4. Cơ sở dữ liệu 

Trên Web có hàng trăm cơ sở dữ liệu khác được các tổ 
chức, có quan cins cấp lên Web để truy cập. Các CSDL, này 
được các tổ chức xây dựng cho mục đích nội bộ nhưng được 
họ cung cấp lên mạng để nguươi sử dụng Internet khai thác. 

Các cơ sử dữ liệu này có thể bao quá các lĩnh vực khác 
nhau. Những website cơ sở dữ liệu này cung cấp các công 
cụ tìm kiếm bằng từ khoá để người sử dụng Internet truy 
cập và tìm kiếm trong cơ sở dữ liệu. trong một máy chủ nào 
đó. Mỗi cơ sở dữ liệu có máy tìm tin riêng và cú pháp riêng 
vì thế để khai thấc hiệu quả phải nghiên cứu kỹ phương 
pháp tìm kiếm của từng cơ sở dữ liệu. 

Phương pháp tìm tin trên các cơ sở đữ liệu này nhìn 
chung tương tự như tìm tin tự động hoá và tìm tin bằng máy 
tìm tin. 
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2. CÂU HỎI ÔN TẬP 

na 2.i Chương l: 

Câu 1. Tra cứu thông tin là gì? Cơ sở phân loại các loại 
tra cứu? 
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Câu 2. Trình bày các yếu tố của hệ thống tra cứu thông 
tin? 

Câu 3.Trình bày các loại ngôn ngữ tìm tin chính trong 
các cơ quan thông tin thư viện? Phân biệt sự giống và khác 
nhau của các loại ngôn ngữ tìm tin đó (Vẻ cấu trúc; Về nội 
dung; Về mức độ ứng dụng,..)? 

Câu 4. Trình bày thành phần và công dụng của bộ máy 
tra cứu? 

Câu 5. Trình bày vai trò của cán bộ tra cứu và NDT trong 
hệ thống tra cứu thông tin? 

a 2.2 Chương 2: 

Câu 1. Trình bày các nguyên tắc tra cứu? 

Câu 2. Nêu những yếu tố chính để thực hiện việc tra 
cứu? 

Câu 3. Trình bày các bước của quá trình tra cứu? 

Câu 4. Nêu cơ sở đánh giá hiệu quả tra cứu? Các công 
thức tính? Mục đích đánh giá? 

ằ 2.3 Chương 3: 

Câu |: Tra cứu thông tin truyền thống là gì? Các yếu tố 
chính để tiến hành tra tìm? 

Câu 2: Trình bày công dụng của các nguồn tra cứu thông 
tín tư liệu truyền thống? 

Câu 3: Trình bày phương pháp tra cứu thông tin tư liệu 
qua hệ thống mục lục và ấn phẩm thông tin? 
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Câu 4: Tra cứu thông tin đữ kiên là gì? So sánh sự khác 
nhau và giống nhau của tra cứu thông tin tư liệu và thông 
tin dữ kiện? Trình bày cơ sở để tra cứu thông tín dữ kiện 

Câu 5: Trình bày công dụng của các nguồn tra cứu thông 
tin dữ kiện truyền thống và những đặc thù của thông tin dữ 
kiện? phương pháp tra cứu thông tin dữ kiện? 

a 2.4 Chương 4: 

Câu 1. Biểu thức tìm tin là gì?. Có những loại thuật ngữ 
tìm tin nào? 

Câu 2. Hãy trình bày các toán tử boole trong tìm tin tự 
động hoá? 

Câu 3. Hãy giới thiệu trình bày các toán tử tìm tn không 
thuộc nhóm toán tử boole? 

Câu 4. Chiến lược tìm tin tự động hoá là gì? Có những 
chiến lược tìm tin cơ bản nào? 

Câu 5. Tìm tin trực tuyến là gì? Hãy cho biết có những 
thành phần cơ bản nào tham gia vào công nghiệp thông tin 
trực truyến? ` 

Câu 6. CDROM là gì? Hãy so sánh tìm tin trên CDROM 
và tìm tin trực tuyến? 

n 2.5 Chương 5: 

Câu l. Hãy cho biết Internet là gì? Trình bày các khái 
niệm địa chỉ IP, địa chỉ tên miền. Giới thiệu sơ lược những 
dịch vụ cơ bản của Internet. 





Câu 2. World Wide Web là gì? Hãy cho biết có những 
nguồn tin gì trên Internet?. 

Câu 3. Hãy giới thiệu phương pháp bằng từ khoá và công 
cụ tìm tin liên quan trên Internet? 


Câu 4. Hãy giới thiệu phương pháp tìm tin theo chủ đẻ? 


3. BÀI TẬP THỰC HÀNH ' 

a_3.I Tìm tín truyền thống 

ad) Tra cứu thông tin thự muc› 

1. Tập thơ Từ ấy của nhà thơ Tố Hữu được tái bản bao 
nhiêu lần? Vào những năm nào? 

2. Có bao nhiêu tác phẩm của dịch giả Đoàn Tử Huyền 
có trong thư viện trường ĐHVH? Nêu tên những tác phẩm 
đó? 

3. Ai viết truyện ngắn Những người thích đàa?- 

4. Lập danh mục tài Hệu về mổ nột soi.tiêu hoá xuất bản 
từ năm 2000 - 2003 ? 

3. Hai nhà thơ Xuân Diệu và Huy Cận xuất bản bao 
nhiêu tập thơ chung? Nêu tên và năm xuất bản những tập 
thơ đó? 

6. Nêu mã ngành và nơi bảo vệ luận án tiến sỹ (LATS) 
của NCS Nguyễn văn Cần? 

+. Tìm các tài liệu có đề cập tới Sông Mã xuất bản từ 
năm 2001 - 2002? 
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8. Nêu tên các tác giả có nhiêù công trình để cập đến 
Bảo vệ động vật quý hiếm ở VN? 
9. Tìm 5 tài liệu bằng tiếng Kmer xuất bản từ năm 1999 
- 2002? 
10. Cho biết tên các bài báo tạp chí mới nhất đẻ cập tới ó 
nhiễm nguồn nước thành phố? 
-_EL: Azmaroy là nhà văn nước nào? Có tác phẩm nào nổi 
tiếng? Những tác phẩm nào đã được dịch sang tiếng Việt?. 
b} Tra cứu thông tin dữ kiên: 
I- Cho biết năm sinh và năm mất của Hưng Đạo 
Vương Trần Quốc Tuấn? 
2- Nữ hoàng Elizabeth IÍ đãng quang khi nào? 
3- Nicolas Copemic là ai? Tóm tắt tiểu sử của ông? 
4- Tóm tắt lịch sử kênh đào Panama? 
5- 9 tháng 5 năm 1945 là ngày gì? 
6- Năm 1898 ai là Vua của Việt Nam? 
7- Cho biết trụ sở và điện thoại giao dịch của Ngân 
hàng Ngoại thương VN? : 
8- Chức năng của Tổ Chức Y Tế Thế Giới là gì? 
9- Cho biết số liệu về sinh sản, kết hôn và chết ở Việt 
Nam từ năm 2000 - 2003. 
10- Hiện nay ở VN có bao nhiêu KM đường quốc lộ? 
11- Nêu tên 3 chiếc cầu đài nhất thế giới hiện nay? 
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12- Người Tajikisstan nói tiếng gì? 

a 3.2 Tìm tín Tự động hoá 

I. THỰC HÀNH TÌM TIN BẰNG CHƯƠNG TRÌNH WINISIS 

Mục đích | 

Winisis là một chương trình lưu trữ và tìm tin rất phổ 
biến ở Việt Nam. Chương trình cung cấp các phương tiện 
tra cứu tin từ cơ sở dữ liệu rất tiêu chuẩn. Vì vậy việc học sử 
dụng Winisis sẽ cung cấp cho học viên những kỹ năng về 
sử dụng các toán tử, kết hợp toán tử để tạo câu hỏi phức tạp, 
sử dụng từ điển (tệp đảo của cơ sở dữ liệu để tra cứu tin). 

Mục đích cụ thể của bài tập thực hành này là giúp học 
viên: 

- Biết cách dùng lệnh tìm tin 

- Biết cách sử dụng toán tử: toán tử boole; toán tử lân 
cận; sử dụng ký hiệu chặt cụt; 

- Tìm hiểu sự ưu tiên xử lý của toán tử 

- Biết sử đụng dấu ngoặc để tạo thay mức ưu tiên câu hỏi 

- Biết sử dụng toán hạng (ID) để tìm hạn chế theo 
trường 

Khởi động chương trình 

Sau khi khởi động chương trình Winisis, chúng ta thực 
hiện các bước chọn thực đơn như sau: 

Tìm tin ==> Tìm tin trình độ cao 
Chúng ta thấy cửa số tìm tin như sau: 
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F.Í E:Xwarrsis\data\std mst - Cầu 








——rxcr.~ccc. — — |Tứđiển m 


Danh sắch câu hỏi Lan ¬ Trợ Giúp 


- : 


Bài tập 1. Xem xét việc so sánh giữa "khái niệm” và 
"ký hiệu" 

Bày này nhằm làm cho học viên hiểu rõ máy tính làm 
việc với ký hiệu mà không hiểu khái niệm. 





Đánh các lệnh tìm sau và cho biết số biểu ghi tìm được: 
thủy lợi 
thuỷ lợi 
hoá học 
hóa học 
Giải thích lý do khác nhau. 
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Bài 2. Sử dụng toán tử OR (dấu +) để mở rộng kết 
qua tìm 
Toán tử OR cho phép mở rộng kết quả tìm kiếm. Sử 
dụng với các từ đồng nghĩa hoặc mở rộng khái niệm. Tìm 
thử các câu hỏi: 
thuỷ lợi + thủy lợi 
hoá học + hóa học 
Giải thích lý do số biểu ghi tầng lên so với tìm riêng 
hoá học" hoặc "hóa học”. Rút ra kết luận øì? 
Bài tập 3. Sử dụng toán tử AND (đấu *) 
Đánh các câu hỏi sau và cho biết số biểu ghi tìm được. 
chọn giống lúa 
chọn giống * lúa 
đầu tư * nông nghiệp 
đầu tư cho nông nghiệp 
Giải thích sự khác nhau vẻ kết quả tìm. Rút ra kết luận 
gì? 


Bài tập 4. Sử dụng toán tử lân cân (dấu chấm) 
Tìm tin bằng cụm từ và dùng toán tử lân cận, cho biết 
kết quả tìm được, 
chọn giống * lúa 
chọn . giống * lúa 
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nông nghiệp 
nóng . nghiệp 
nông (f) nghiệp 
Giải thích sự khác nhau về kết quả tìm. Rút ra kết luận 
g"? 


Bài tập Š. Sử dụng ký hiệu chặt cụt (dấu $) 
Tìm tin bằng cụm từ và dùng toán tử lân cận 

chọn giống 

chọn giống$ 

thông tin 

thông tin$ 
Giải thích sự khác nhau về số biểu ghi tìm được. Rút ra 

kết luận gì? 


Bài tập 6. Tìm hiểu mức ưu tiên của toán tử 
Đánh các biểu thức tìm tin như đưới đây và ghi lại thứ tự 
lệnh tìm và số biểu ghi tìm được. 
A+B*C+D*E 
(A + B) * (C + D) * E 
A+B*(C+D*E) 
Giải thích sự khác nhau trong số biểu ghi tìm được và 
thứ tự thực hiện lệnh. 
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Bài tập 7. Sử dụng toán hạng /(Ð) đề fìm han chế 
theo trường 
Thực hiện các biểu thức tìm sau và cho biết kết quả tìm 
tin. 
chọn giống/(312) 
chọn giống 
lúa 
lúa/(312) 
tlúa/(200) 
chọn giống$ * lúa/(200) 
chọn giống$ (F) lúa/(200) 
Giải thích sự khác nhau trong số biểu ghi tìm được và 
thứ tự thực hiện lệnh. 


Bài 8. Tự thực phân tích và thực hiện câu hỏi 


Hãy tìm tài liệu nói về ảnh hưởng của thuốc bảo vệ thực 
vật đối với thiên nhiên và con người. 
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2. THỰỤC TẬP VỚI CHƯƠNG TRÌNH ĐIALOG 
ONDISK 

MỤC ĐÍCH: 

Mục đích của những bài tập này nhằm: 

- Làm quen với việc phân tích yêu cầu và chuẩn bị câu 
hỏi với hệ thống: 

- Làm quen và nắm vững những lệnh cơ bản của chương 
trình tìm tin của DILALOG 

- Thực táp áp dụng những chiến lược tìm tin khác nhau 
như: Xây dựng khối, Nuôi ngọc trai,... 

KHỞI ĐỘNG CHƯƠNG TRÌNH 

Chương trình Dialog trên CDROM có tên tệp là 
ondisk.exe có trên máy chủ Việc khởi động chương trình 
phụ thuộc vào cài đặt trên máy chủ. 

Chọn và Kích đúp ONDISC.EXE 

Khi chương trình khởi động chúng ta sẽ thấy thực đơn 

tương tự như sau: 


|_ Select Search Mode 


Easy Menu Scarch 
Dialog Camtrmand Search 
Online Search 


Setup and Accounting 
Exii to DOS 
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Để thực hiện tìm tin theo thực đơn. ta chọn Easy Menu 
Search. 


Để thực hiện tìm theo dòng lệnh. ta chuyển thanh chọn 
lệnh đếm: 


Đialog Comrmand Search 

Hoặc bấm ký tự đại diện <D> 

Chú ý: không dùng chuột mà phải dùng phím mũi 
tên để dịch chuyển đến chức năng cần chọn. 

Chúng ta sẽ thấy thông báo như sau: 












Et EEDisc(tm) 
The Datubase fr C 0nputter dul Elecirical Engtheering 






(EL) Engineering Iormatian lục, 


Thy databdse ïs a subxet Gƒ Dialoght online Fửe 8.Ei 
COMPENDEXFPLUSInu] 


ÄÍO€ CHrreHl records má be fannd onhne ín File 8. 
Copviight (c) T994. (Eñ Engineering hƒoanmation Iàác. All rights 
"reserved 
Copvrigiu (c¡ 1094, DHIALOG THƒOmatlnn Services, lục. 
All nghĩs reservred. No CÍHÙM to 












@lietndll U 5Š, GovfT suurks. 





Comunand Search 

Dialog User Interface ay AwdiolVisual ME, 
Copyriplhtt (c) 1986 Dialog Inƒormanon Services, lục. 
Portliom (c) 1987, I90J Digital Library Systems, lne 
El EEDisc 1992 - December J994 
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Set Hems Descripilon 


Tại đấu nhắc (?) ta đánh các lệnh. 
Thí dụ: 


?S compufter 


CÁC BÀI TẬP THỰC HÀNH 
1. Lệnh tim (SelecU), lệnh xem kết quả (Type) và 
thoát ra (Logoff) 


?% information Tìm các biểu ghi về công nghệ thông tín 


tcchnology - Tìm hiểu xem thông báo của hệ thống, 
nhận biết số của câu hỏi, số biểu phi tìm 
được. 

?T S1/5/1-3 Xem kết quả tìm của câu hỏi số 1, theo 
format số 5 (đầy đủ), từ biểu l-5 

? Logoff Thoát ra khỏi lệnh tìm, về menu 


2. Sử dụng lệnh trợ giúp tìm các format 

Vào trở lại lệnh. 
* HELP Hiện thông báo về các loại lệnh 
?HELPFORMAT Hiện thông báo về các loại FORMAT 
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Cho biết có bao nhiêu loại lệnh và có bao nhiêu loại 
Format ? 
Liệt kê tên FORMAT 


3. sử dụng các toán tử AND, (W), (N) và so sánh kết 
quả 


Thực hiện lệnh tìm cho các câu hỏi sau và cho biết số 
biểu ghi tìm được. 
?S information technology 
? 3 technology information _ 
?S information AND technology 
° § technology AND information 
?S information (W) technology 
?5 technology (W) information 
? § information (N) technology 
?3 technology (N) information 
7S information (3W) technolopgy 
?§ information (3N) technology 
?§ information (L) technology 
?Š technology (L) information 
?SŠ information (S) technology 
78 technology (S) information 
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Cho biết kết quả của từng lệnh tìm. Giải thích lý do của 
sự khác biệt đó. 


4. Sử dụng toán tử chặt cụt ở cuối từ 

Thực hiện các lệnh tìm: 

?§ COMPUTER 

?§S COMPUTER? 

?S COMPUT? 

Cho biết mỗi biểu thức cho kết quả bao nhiêu biểu ghi. 
Giải thích sự khác nhau của kết quả. 


5. Sử dụng toán tử chặt cụt () ở giữa từ 

Thực hiện lệnh tìm với các biểu thức sau: 

?§ WOMAN 

?5 WOMEN 

?SWOM?N 

? S organisation 

? 5 0rganization 

? Sorgani?ation 

Cho biết mỗi lệnh cho bao nhiêu biểu ghi, biểu thức tìm 
nào cho số biểu ghi nhiều nhất?, Tại sao?. 
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6. Sử dụng EXPAND để xem từ điển và tìm tim theo 
từ điển. 
?EXPANDLIBRARY Xem từ điển bát dầu bảng từ 
Library. Chọn từ có số n để tìm 
tin 


7. Sử đụng lệnh tìm kết hợp câu hỏi trước 


?S5 LIBRARY Xem và nhớ số của câu hỏi (thí 
dụ là SĨ 

?SCOMPUT#R? Xem và nhớ số của câu hỏi (thí 
dụ là S2) 

?SSI AND S2 


3.3 Tìm tỉn trên Internet 


3. THỰC HÀNH TÌM TIN TRÊN INTERNET BẰNG 
VAHOO 

Yêu cầu là phải có kết nối mạng Imemet. Khi đã kết nối, 
chúng ta khởi động Internet Explorer và đánh vào ô 
ADDRESS địa chỉ URL sau: 

http://www.yahoo.com/ 

1. Tìm theo liệt kẻ 

a. Dùng phương pháp liệt kê tìm Website của Thư 
viện Quốc hội Mỹ. 
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Mỡ Yahoo ==> Chọn Reference z=> Libraries => 
Nalional Libraries ==> United State Library of 
Congress 


b. Phương Liệt kê Dùng phương pháp liệt kê tìm 
Website Danh bạ công ty sản xuất ở Australia 

Mở Yahoo ==> Business and Economy ==> 
Directories => Companies ==> Manufacturing => 
Australian Manufacuturer's Guiđe ==> xem công ty 


c. Dùng Phương pháp liệt kê để tìm công cụ tra cứu 
Mở Yahoo ==> Reference == > Acronyms and 
Abbreviation ==> Acronym Finder 


Khi thấy cửa số chương trình tra cứu, đánh các từ viết tắt 
vào để tìm các từ viết tất: KISS, MMDS, AIDS, SARS là gì, 
_có mấy cách giải thích 
Vào một số mục và đi sâu dần vào theo chủ để được 
chọn (Phương pháp liệt kê đơn giản). 


2. Tìm theo từ khóa 

Tại của số tìm tin, nhập yêu cầu cần tìm. Thí dụ: 
Microsoft 

Kích chuột nút SEARCH 
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Chọn mục cần/muốn xem trong kết quả thu được 


a. Thử nghiệm các toán tử: 
Toán tử +/- 
Xem sự khác nhau giữa kết quả của ba câu hỏi:: 
Vietnam War 
Vietnam -War 
Vietnam +War 
Hoặc 
Vietnam Culiture Folklore 
Vietnam Culture +Foiklore 
Vietnam -Cul(ure +Folklore 
b. Tìm giới hạn theo trường 
t:IFLA 
u:intel 
c. Dâu "..." 
Tìm hiểu sự khác nhau về kết quả giữa 
“information science" 


information science 


"great barrier rcef" 
great barrier recf 
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4. THỤC HÀNH TÌM TIN TRÊN INTERNET VIỆT 
NAM BẰNG MÁY TÌM TIN VINASEEK 


Cách thức tìm kiếm trên VinaSeek rất đơn giản: chỉ việc 
gỗ vào ô tìm kiếm một số từ khoá hoặc câu tiếng Việt. 

Để tìm tin bằng Vinaseek, thực hiện các bước sau: 

- Truy cập trang Web của Vinascek: 

http://www.vinaseek.com/ 


- Chọn bộ mã ký tự muốn sử dụng: TCVN, UNICODE, 
. VNI... 
- Nhập câu hỏi vào ô cửa số tìm kiếm. 
Hãy nhập các câu hỏi sau, cho biết số trang tìm được, 
giải thích tại sao? 
e© thị trường chứng khoán 
© "thị trường chứng khoán” 
»© “Thị Trường Chứng Khoán" 
se +”thị trường” +"chứng khoán" 
»® +"thị trườnG chứng khoáN" 
® +”thị trường chứng khoán" +titfe:" bản tỉn nhanh" 
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